Pourquoi la taille de l’échantillon est-elle importante ? (Explication & Exemples)



La taille de l’échantillon fait référence au nombre total de personnes impliquées dans une expérience ou une étude.

La taille de l’échantillon est importante car elle affecte directement la précision avec laquelle nous pouvons estimer les paramètres de la population.

Pour comprendre pourquoi c’est le cas, il est utile d’avoir une compréhension de base des intervalles de confiance.

Une brève explication des intervalles de confiance

En statistiques, nous cherchons souvent à mesurer les paramètres d’une population – des nombres qui décrivent certaines caractéristiques d’une population entière.

Par exemple, nous pourrions être intéressés à mesurer la taille moyenne de tous les individus dans une certaine ville.

Cependant, il est souvent trop coûteux et trop long de collecter des données sur chaque individu d’une population. Nous prenons donc généralement un échantillon aléatoire de la population et utilisons les données de l’échantillon pour estimer le paramètre de population.

Par exemple, nous pourrions collecter des données sur la taille de 100 individus aléatoires dans la ville. On peut alors calculer la taille moyenne des individus de l’échantillon. Cependant, nous ne pouvons pas être certains que la moyenne de l’échantillon correspond exactement à la moyenne de la population.

Pour tenir compte de cette incertitude, nous pouvons créer un intervalle de confiance . Un intervalle de confiance est une plage de valeurs susceptible de contenir un paramètre de population avec un certain niveau de confiance.

La formule pour calculer un intervalle de confiance pour une moyenne de population est la suivante :

Intervalle de confiance = x +/- z*(s/√ n )

où:

  • x : moyenne de l’échantillon
  • z : la valeur z choisie
  • s : écart type de l’échantillon
  • n : taille de l’échantillon

La valeur z que vous utiliserez dépend du niveau de confiance que vous choisissez. Le tableau suivant montre la valeur z qui correspond aux choix de niveaux de confiance les plus courants :

Un niveau de confiance valeur z
0,90 1,645
0,95 1,96
0,99 2,58

La relation entre la taille de l’échantillon et les intervalles de confiance

Supposons que nous souhaitions estimer le poids moyen d’une population de tortues. Nous collectons un échantillon aléatoire de tortues avec les informations suivantes :

  • Taille de l’échantillon n = 25
  • Poids moyen de l’échantillon x = 300
  • Écart type de l’échantillon s = 18,5

Voici comment calculer l’intervalle de confiance à 90 % pour le poids moyen réel de la population :

Intervalle de confiance à 90 % : 300 +/- 1,645*(18,5/√ 25 ) = [293,91, 306,09]

Nous sommes sûrs à 90 % que le poids moyen réel des tortues dans la population se situe entre 293,91 et 306,09 livres.

Supposons maintenant qu’au lieu de 25 tortues, nous collections des données sur 50 tortues.

Voici comment calculer l’intervalle de confiance à 90 % pour le poids moyen réel de la population :

Intervalle de confiance à 90 % : 300 +/- 1,645*(18,5/√ 50 ) = [295,79, 304,30]

Notez que cet intervalle de confiance est plus étroit que l’intervalle de confiance précédent. Cela signifie que notre estimation du poids moyen réel de la population de tortues est plus précise.

Supposons maintenant que nous collections des données sur 100 tortues.

Voici comment calculer l’intervalle de confiance à 90 % pour le poids moyen réel de la population :

Intervalle de confiance à 90 % : 300 +/- 1,645*(18,5/√ 100 ) = [296,96, 303,04]

Notez que cet intervalle de confiance est encore plus étroit que l’intervalle de confiance précédent.

Le tableau suivant résume chacune des largeurs d’intervalle de confiance :

Voici ce qu’il faut retenir : plus la taille de l’échantillon est grande, plus nous pouvons estimer avec précision un paramètre de population .

Ressources additionnelles

Les didacticiels suivants fournissent d’autres explications utiles sur les intervalles de confiance et la taille de l’échantillon.

Une introduction aux intervalles de confiance
4 exemples d’intervalles de confiance dans la vie réelle
Population vs échantillon : quelle est la différence ?

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *