La condition d’un grand échantillon : définition & Exemple



En statistiques, nous souhaitons souvent utiliser des échantillons pour tirer des conclusions sur les populations au moyen de tests d’hypothèses ou d’intervalles de confiance .

La plupart des formules que nous utilisons dans les tests d’hypothèses et les intervalles de confiance supposent qu’un échantillon donné suit à peu près unedistribution normale .

Cependant, afin de formuler cette hypothèse en toute sécurité, nous devons nous assurer que la taille de notre échantillon est suffisamment grande. Plus précisément, nous devons nous assurer que la condition relative au grand échantillon est remplie.

La condition de grand échantillon : la taille de l’échantillon est d’au moins 30.

Remarque : Dans certains manuels, une taille d’échantillon « suffisamment grande » est définie comme étant d’au moins 40, mais le nombre 30 est plus couramment utilisé.

Lorsque cette condition est remplie, on peut supposer que la distribution d’échantillonnage de la moyenne de l’échantillon est approximativement normale. Cette hypothèse nous permet d’utiliser des échantillons pour tirer des conclusions sur les populations dont ils sont issus.

La raison pour laquelle le nombre 30 est utilisé est basée sur le théorème central limite. Vous pouvez en savoir plus à ce sujet dans cetarticle de blog .

Exemple : Vérification de l’état d’un grand échantillon

Supposons qu’une certaine machine crée des crackers. La répartition du poids de ces cookies est asymétrique vers la droite avec une moyenne de 10 onces et un écart type de 2 onces. Si nous prenons un échantillon aléatoire simple de 100 cookies produits par cette machine, quelle est la probabilité que le poids moyen des cookies de cet échantillon soit inférieur à 9,8 onces ?

Afin de répondre à cette question, nous pouvons utiliser le calculateur CDF normal , mais nous devons d’abord vérifier que la taille de l’échantillon est suffisamment grande pour supposer que la distribution de la moyenne d’échantillonnage est normale.

Dans cet exemple, la taille de notre échantillon est n = 100 , ce qui est bien supérieur à 30. Malgré le fait que la véritable distribution du poids des cookies soit asymétrique vers la droite, puisque la taille de notre échantillon est « suffisamment grande », nous pouvons supposer que la distribution de la moyenne d’échantillonnage est normale. Ainsi, nous pourrions utiliser en toute sécurité le calculateur CDF normal pour résoudre ce problème.

Modifications de la condition des grands échantillons

Souvent, une taille d’échantillon est considérée comme « suffisamment grande » si elle est supérieure ou égale à 30, mais ce nombre peut varier légèrement en fonction de la forme sous-jacente de la répartition de la population.

En particulier:

  • Si la répartition de la population est symétrique, une taille d’échantillon aussi petite que 15 suffit parfois.
  • Si la répartition de la population est asymétrique, un échantillon d’au moins 30 personnes est généralement nécessaire.
  • Si la répartition de la population est extrêmement asymétrique, un échantillon de 40 personnes ou plus peut être nécessaire.

Selon la forme de la répartition de la population, vous aurez peut-être besoin d’une taille d’échantillon supérieure ou inférieure à 30 pour que le théorème central limite s’applique.

Ressources additionnelles

Introduction au théorème central limite
Introduction aux distributions d’échantillonnage

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *