Variance de l’échantillon par rapport à la variance de la population : quelle est la différence ?



La variance est un moyen de mesurer la répartition des valeurs dans un ensemble de données.

La formule pour calculer la variance de la population est la suivante :

σ 2 = Σ (x je – μ) 2 / N

où:

  • Σ : Un symbole qui signifie « somme »
  • μ : Moyenne de la population
  • x i : Le i ème élément de la population
  • N : Taille de la population

La formule pour calculer la variance de l’échantillon est la suivante :

s 2 = Σ (x jex ) 2 / (n-1)

où:

  • x : moyenne de l’échantillon
  • x i : Le i ème élément de l’échantillon
  • n : Taille de l’échantillon

Notez qu’il n’y a qu’une infime différence entre les deux formules :

Lorsque nous calculons la variance de la population, nous divisons par N (la taille de la population).

Lorsque nous calculons la variance de l’échantillon, nous divisons par n-1 (la taille de l’échantillon – 1).

Lors du calcul de la variance de l’échantillon, nous appliquons ce qu’on appelle la correction de Bessel , qui consiste à diviser par n-1.

Sans s’embourber dans les détails mathématiques, la division par n-1 peut s’avérer fournir une estimation impartiale de la variance de la population, qui est de toute façon la valeur qui nous intéresse habituellement.

Quand calculer la variance de l’échantillon par rapport à la variance de la population

Si vous ne savez pas si vous devez calculer la variance de l’échantillon ou la variance de la population, gardez cette règle générale à l’esprit :

Vous devez calculer la variance de l’échantillon lorsque l’ensemble de données avec lequel vous travaillez représente un échantillon prélevé sur une population d’intérêt plus large.

Vous devez calculer la variance de la population lorsque l’ensemble de données avec lequel vous travaillez représente une population entière, c’est-à-dire chaque valeur qui vous intéresse.

Les exemples suivants montrent différents scénarios permettant de calculer la variance de l’échantillon par rapport à la variance de la population.

Exemple : calcul de la variance de l’échantillon

Supposons qu’un botaniste veuille calculer la variation de hauteur d’une certaine espèce de plante. Comme il existe des milliers de plantes individuelles dans une région, elle décide de prélever un échantillon aléatoire simple de 20 plantes et de mesurer chacune de leurs hauteurs.

Dans ce scénario, le botaniste doit calculer la variance de l’échantillon car il s’intéresse à la variance de l’ensemble de la population de plantes mais utilise simplement cet échantillon pour estimer la véritable variance de la population.

Exemple : calcul de la variance de la population

Supposons qu’un enseignant veuille calculer la variance des résultats aux examens des 20 élèves de sa classe.

Dans ce scénario, l’enseignant doit calculer la variance de la population , car l’ensemble de données avec lequel il travaille (les 20 résultats des examens) représente l’ensemble de la population qui l’intéresse.

Ressources additionnelles

Les didacticiels suivants expliquent comment calculer la variance de l’échantillon et la variance de la population dans différents logiciels statistiques :

Comment calculer la variance de l’échantillon et de la population dans Excel
Comment calculer la variance de l’échantillon et de la population dans R
Comment calculer la variance de l’échantillon et de la population en Python

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *