La taille minimale de l’échantillon pour un test t : explication & Exemple



Une question fréquemment posée par les étudiants est la suivante :

Existe-t-il une taille d’échantillon minimale requise pour effectuer un test t ?

La réponse courte :

Non. Il n’y a pas de taille d’échantillon minimale requise pour effectuer un test t.

En fait, le premier test t jamais réalisé n’utilisait qu’un échantillon de quatre personnes .

Cependant, si les hypothèses d’un test t ne sont pas remplies, les résultats pourraient alors ne pas être fiables.

De plus, si la taille de l’échantillon est trop petite, la puissance du test pourrait être trop faible pour détecter des différences significatives dans les données.

Examinons chacun de ces problèmes potentiels plus en détail.

Comprendre les hypothèses des tests t

Un test t sur un échantillon est utilisé pour tester si la moyenne d’une population est égale ou non à une certaine valeur.

Ce test fait les hypothèses suivantes :

  • Indépendance : Les observations de l’échantillon doivent être indépendantes.
  • Échantillonnage aléatoire : les observations doivent être collectées à l’aide d’une méthode d’échantillonnage aléatoire afin de maximiser les chances que l’échantillon soit représentatif de la population d’intérêt.
  • Normalité : Les observations doivent être à peu près normalement distribuées.

Un test t à deux échantillons est utilisé pour vérifier s’il existe une différence significative entre les moyennes de deux populations.

Ce test fait les hypothèses suivantes :

  • Indépendance : les observations de chaque échantillon doivent être indépendantes.
  • Échantillonnage aléatoire : les observations de chaque échantillon doivent être collectées à l’aide d’une méthode d’échantillonnage aléatoire.
  • Normalité : chaque échantillon doit être distribué à peu près normalement.
  • Variance égale : chaque échantillon doit avoir à peu près la même variance.

Lors de l’exécution de chaque type de test t, si une ou plusieurs de ces hypothèses ne sont pas remplies, les résultats du test peuvent devenir peu fiables.

Dans ce cas, il est préférable d’utiliser un test alternatif non paramétrique qui ne fait pas ces hypothèses.

L’alternative non paramétrique à un test t à un échantillon est le test de classement signé de Wilcoxon .

L’alternative non paramétrique à un test t à deux échantillons est le test U de Mann-Whitney .

Comprendre la puissance des tests t

La puissance statistique fait référence à la probabilité qu’un test détecte un effet alors qu’il existe réellement.

On peut montrer que plus la taille de l’échantillon utilisé est faible, plus la puissance statistique d’un test donné est faible. C’est pourquoi les chercheurs souhaitent généralement des échantillons de plus grande taille afin d’avoir une puissance plus élevée et donc une plus grande probabilité de détecter de véritables différences.

Par exemple, supposons que la taille réelle de l’effet entre deux populations soit de 0,5 – une taille d’effet « moyenne ». Nous pouvons utiliser le code R suivant pour calculer la puissance d’un test t à deux échantillons en utilisant différentes tailles d’échantillon :

#sample size n=10
power.t.test(n=10, delta=.5, sd=1, sig.level=.05, type='two.sample')$power

[1] 0.1838375

#sample size n=30
power.t.test(n=30, delta=.5, sd=1, sig.level=.05, type='two.sample')$power

[1] 0.477841

#sample size n=50
power.t.test(n=50, delta=.5, sd=1, sig.level=.05, type='two.sample')$power

[1] 0.6968888

Voici comment interpréter les résultats :

  • Lorsque la taille de chaque échantillon est n = 10, la puissance est de 0,184 .
  • Lorsque la taille de chaque échantillon est n = 30, la puissance est de 0,478 .
  • Lorsque la taille de chaque échantillon est n = 50, la puissance est de 0,697 .

Nous pouvons voir que la puissance du test augmente à mesure que la taille de l’échantillon augmente.

Ainsi, nous n’avons pas besoin d’une taille d’échantillon minimale pour effectuer un test t, mais de petites tailles d’échantillon conduisent à une puissance statistique inférieure et donc à une capacité réduite à détecter une véritable différence dans les données.

Conclusion

Voici un résumé de ce que nous avons appris :

  • Il n’y a pas de taille d’échantillon minimale requise pour effectuer un test t.
  • Si les hypothèses d’un test t ne sont pas remplies, nous devons utiliser une alternative non paramétrique.
  • Si la taille de l’échantillon est trop faible, la puissance du test t sera faible et la capacité du test à détecter de véritables différences dans les données sera faible.

Ressources additionnelles

Les didacticiels suivants offrent des informations supplémentaires sur les tests t.

Une introduction au test t sur un échantillon
Une introduction au test t à deux échantillons
Une introduction au test t pour échantillons appariés
Les quatre hypothèses formulées dans un test t

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *