Qu’est-ce que la variabilité d’échantillonnage ? Définition & Exemple
Souvent, dans les statistiques, nous souhaitons répondre à des questions telles que :
- Quel est le revenu moyen des ménages dans un certain État ?
- Quel est le poids moyen d’une certaine espèce de tortue ?
- Quelle est la fréquentation moyenne des matchs de football universitaire ?
Dans chaque scénario, nous souhaitons répondre à une question sur une population , qui représente tous les éléments individuels possibles que nous souhaitons mesurer.
Cependant, au lieu de collecter des données sur chaque individu d’une population, nous collectons plutôt des données sur un échantillon de la population, qui représente une partie de la population totale.
Par exemple, nous pourrions vouloir connaître le poids moyen d’une certaine espèce de tortue qui compte une population totale de 800 tortues.
Comme il faudrait trop de temps pour localiser et peser chaque tortue de la population, nous collectons plutôt un simple échantillon aléatoire de 30 tortues et les pesons :
Nous pourrions alors utiliser le poids moyen de cet échantillon de tortues pour estimer le poids moyen de toutes les tortues de la population.
La variabilité d’échantillonnage fait référence au fait que la moyenne variera d’un échantillon à l’autre.
Par exemple, dans un échantillon aléatoire de 30 tortues, la moyenne de l’échantillon peut s’avérer être de 350 livres. Dans un autre échantillon aléatoire, la moyenne de l’échantillon peut être de 345 livres. Dans encore un autre échantillon, la moyenne de l’échantillon peut être de 355 livres.
Il existe une variabilité parmi les moyennes de l’échantillon.
Comment mesurer la variabilité d’échantillonnage
En pratique, nous ne collectons qu’un seul échantillon pour estimer un paramètre de population. Par exemple, nous ne collecterons qu’un seul échantillon de 30 tortues marines pour estimer le poids moyen de l’ensemble de la population de tortues.
Cela signifie que nous ne calculerons qu’une seule moyenne d’échantillon ( x ) et l’utiliserons pour estimer la moyenne de la population (μ).
Moyenne de l’échantillon = x
Mais nous savons que la moyenne de l’échantillon varie d’un échantillon à l’autre. Ainsi, pour tenir compte de cette variabilité, nous pouvons utiliser la formule suivante pour estimer l’écart type de la moyenne de l’échantillon :
Écart type de la moyenne de l’échantillon = s / √ n
où:
- s : l’écart type de l’échantillon
- n : La taille de l’échantillon
Par exemple, supposons que nous collectons un échantillon de 30 tortues de mer et constatons que le poids moyen de l’échantillon est de 350 livres et que l’écart type de l’échantillon est de 12 livres. Sur la base de ces chiffres, nous calculerions :
Moyenne de l’échantillon = 350 livres
Écart type de la moyenne de l’échantillon = 12 / √ 30 = 2,19 livres
Cela signifie que notre meilleure estimation du poids moyen réel de la population de toutes les tortues est de 350 livres, mais que nous devrions nous attendre à ce que la moyenne d’un échantillon à l’autre varie avec un écart type d’environ 2,19 livres.
Une propriété intéressante de l’écart type de la moyenne de l’échantillon est qu’il devient naturellement plus petit à mesure que nous utilisons des tailles d’échantillon de plus en plus grandes.
Par exemple, supposons que nous collectons un échantillon de 100 tortues de mer et constatons que le poids moyen de l’échantillon est de 350 livres et que l’écart type de l’échantillon est de 12 livres. L’écart type de la moyenne de l’échantillon serait alors calculé comme suit :
Écart type de la moyenne de l’échantillon = 12 / √ 100 = 1,2 livre
Notre meilleure estimation de la moyenne de l’échantillon serait toujours de 350 livres, mais nous pouvons nous attendre à ce que la moyenne d’un échantillon de 100 tortues de mer à l’échantillon suivant de 100 tortues de mer varie avec un écart type de seulement 1,2 livre.
En d’autres termes, il y a moins de variabilité entre les moyennes des échantillons lorsque la taille des échantillons est plus grande.
Ressources additionnelles
Qu’est-ce qu’une distribution d’échantillonnage ?
Une introduction au théorème central limite
Calculateur du théorème central limite