Théorème central limite : les quatre conditions à remplir
Le théorème central limite stipule que la distribution d’échantillonnage d’une moyenne d’échantillon est approximativement normale si la taille de l’échantillon est suffisamment grande, même si la distribution de la population n’est pas normale .
Pour appliquer le théorème central limite, quatre conditions doivent être remplies :
1. Randomisation : Les données doivent être échantillonnées de manière aléatoire de sorte que chaque membre d’une population ait une probabilité égale d’être sélectionné pour faire partie de l’échantillon.
2. Indépendance : Les valeurs des échantillons doivent être indépendantes les unes des autres.
3. La condition des 10 % : lorsque l’échantillon est tiré sans remplacement, la taille de l’échantillon ne doit pas dépasser 10 % de la population.
4. Condition de grand échantillon : La taille de l’échantillon doit être suffisamment grande.
Ce didacticiel fournit une brève explication de chaque condition.
Condition 1 : randomisation
Afin d’appliquer le théorème central limite, les données que nous utilisons doivent être échantillonnées aléatoirement dans la population en utilisant une méthode d’échantillonnage probabiliste .
En statistique, il existe deux types de méthodes d’échantillonnage :
1. Méthodes d’échantillonnage probabiliste : méthodes d’échantillonnage dans lesquelles chaque membre d’une population a une probabilité égale d’être sélectionné pour faire partie de l’échantillon. Les exemples comprennent:
- Échantillon aléatoire simple
- Échantillon aléatoire stratifié
- Échantillon aléatoire en grappes
- Échantillon aléatoire systématique
2. Méthodes d’échantillonnage non probabilistes : méthodes d’échantillonnage dans lesquelles chaque membre d’une population n’a pas la même probabilité d’être sélectionné pour faire partie de l’échantillon. Les exemples comprennent:
- Échantillon de commodité
- Échantillon de réponse volontaire
- Échantillon de boule de neige
- Échantillon délibéré
Il est important d’utiliser une méthode d’échantillonnage probabiliste pour obtenir l’échantillon, car cela maximise les chances d’obtenir un échantillon représentatif de la population .
Condition 2 : Indépendance
Afin d’appliquer le théorème central limite, nous devons également supposer que chacune des valeurs de l’échantillon est indépendante les unes des autres. Autrement dit, la survenance d’un événement n’affecte pas la survenance d’un autre événement.
Cette hypothèse est souvent satisfaite si nous utilisons une méthode d’échantillonnage probabiliste, car ces types de méthodes d’échantillonnage choisissent les observations à inclure dans l’échantillon de manière totalement indépendante les unes des autres.
Condition 3 : la condition des 10 %
Lorsque l’échantillon est tiré sans remise (ce qui est presque toujours le cas), la taille de l’échantillon ne doit pas dépasser 10 % de la population totale.
Par exemple:
- Si la taille de notre population est de 500 personnes, alors la taille de notre échantillon ne devrait pas dépasser 50 personnes.
- Si la taille de notre population est de 1 000 personnes, notre échantillon ne devrait pas dépasser 100 personnes.
- Si la taille de notre population est de 50 000 personnes, alors la taille de notre échantillon ne devrait pas dépasser 5 000 personnes.
Et ainsi de suite.
Condition 4 : Condition d’un grand échantillon
Enfin, pour appliquer le théorème central limite, notre taille d’échantillon doit être suffisamment grande.
En général, nous considérons « suffisamment grand » comme étant égal à 30 ou plus. Cependant, ce nombre peut varier légèrement en fonction de la forme sous-jacente de la répartition de la population.
En particulier:
- Si la répartition de la population est symétrique, une taille d’échantillon aussi petite que 15 suffit parfois.
- Si la répartition de la population est asymétrique, un échantillon d’au moins 30 personnes est généralement nécessaire.
- Si la répartition de la population est extrêmement asymétrique, un échantillon de 40 personnes ou plus peut être nécessaire.
Selon la forme de la répartition de la population, vous aurez peut-être besoin d’une taille d’échantillon supérieure ou inférieure à 30 pour que le théorème central limite s’applique.