Quelle est la différence entre un test T et une ANOVA ?



Ce didacticiel explique la différence entre un test t et une ANOVA , ainsi que le moment d’utiliser chaque test.

Test T

Un test t est utilisé pour déterminer s’il existe ou non une différence statistiquement significative entre les moyennes de deux groupes . Il existe deux types de tests t :

1. Test t pour échantillons indépendants. Ceci est utilisé lorsque l’on souhaite comparer la différence entre les moyennes de deux groupes et que les groupes sont complètement indépendants les uns des autres.

Par exemple, les chercheurs voudront peut-être savoir si le régime A ou le régime B aide les gens à perdre plus de poids. 100 personnes assignées au hasard sont affectées au régime A. 100 autres personnes assignées au hasard sont affectées au régime B. Après trois mois, les chercheurs enregistrent la perte de poids totale de chaque personne. Pour déterminer si la perte de poids moyenne entre les deux groupes est significativement différente, les chercheurs peuvent effectuer un test t sur échantillons indépendants.

2. Test t pour échantillons appariés . Ceci est utilisé lorsque nous souhaitons comparer la différence entre les moyennes de deux groupes et où chaque observation d’un groupe peut être associée à une observation de l’autre groupe.

Par exemple, supposons que 20 élèves d’une classe passent un test, puis étudient un certain guide, puis repassent le test. Pour comparer la différence entre les scores du premier et du deuxième test, nous utilisons un test t apparié car pour chaque élève, son score du premier test peut être associé à son score du deuxième test.

Pour qu’un test t produise des résultats valides, les hypothèses suivantes doivent être respectées :

  • Aléatoire : un échantillon aléatoire ou une expérience aléatoire doit être utilisé pour collecter des données pour les deux échantillons.
  • Normal : La distribution d’échantillonnage est normale ou approximativement normale.

Si ces hypothèses sont satisfaites, il est alors possible d’utiliser un test t pour tester la différence entre les moyennes de deux groupes.

ANOVA

Une ANOVA (analyse de variance) est utilisée pour déterminer s’il existe ou non une différence statistiquement significative entre les moyennes de trois groupes ou plus . Les tests ANOVA les plus couramment utilisés dans la pratique sont l’ANOVA unidirectionnelle et l’ANOVA bidirectionnelle :

ANOVA unidirectionnelle : utilisée pour tester s’il existe ou non une différence statistiquement significative entre les moyennes de trois groupes ou plus lorsque les groupes peuvent être divisés sur un seul facteur .

Exemple : Vous divisez au hasard une classe de 90 élèves en trois groupes de 30. Chaque groupe utilise une technique d’étude différente pendant un mois pour préparer un examen. A la fin du mois, tous les étudiants passent le même examen. Vous souhaitez savoir si la technique d’étude a ou non un impact sur les résultats aux examens. Vous effectuez donc une ANOVA unidirectionnelle pour déterminer s’il existe une différence statistiquement significative entre les scores moyens des trois groupes.

ANOVA bidirectionnelle : utilisée pour tester s’il existe ou non une différence statistiquement significative entre les moyennes de trois groupes ou plus lorsque les groupes peuvent être divisés sur deux facteurs .

Exemple : Vous souhaitez déterminer si le niveau d’exercice (pas d’exercice, exercice léger, exercice intense) et le sexe (homme, femme) ont un impact sur la perte de poids. Dans ce cas, les deux facteurs que vous étudiez sont l’exercice et le sexe et votre variable de réponse est la perte de poids (mesurée en livres). Vous pouvez effectuer une ANOVA bidirectionnelle pour déterminer si l’exercice et le sexe ont un impact sur la perte de poids et pour déterminer s’il existe une interaction entre l’exercice et le sexe sur la perte de poids.

Pour qu’une ANOVA produise des résultats valides, les hypothèses suivantes doivent être respectées :

  • Normalité – toutes les populations que nous étudions suivent une distribution normale. Ainsi, par exemple, si nous voulons comparer les résultats des examens de trois groupes d’étudiants différents, les résultats des examens du premier groupe, du deuxième groupe et du troisième groupe doivent tous être distribués normalement.
  • Variance égale – les variances de population dans chaque groupe sont égales ou approximativement égales.
  • Indépendance – les observations de chaque groupe doivent être indépendantes les unes des autres. Habituellement, un plan randomisé s’en occupe.

Si ces hypothèses sont remplies, il est alors possible d’utiliser une ANOVA pour tester la différence entre les moyennes de trois groupes ou plus.

Comprendre les différences entre chaque test

La principale différence entre un test t et une ANOVA réside dans la manière dont les deux tests calculent leur statistique de test pour déterminer s’il existe une différence statistiquement significative entre les groupes.

Un test t pour échantillons indépendants utilise la statistique de test suivante :

statistique de test t = [ ( x 1x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

x 1 et x 2 sont les moyennes de l’échantillon pour les groupes 1 et 2, d est la différence hypothétique entre les deux moyennes (souvent elle est nulle), s 1 2 et s 2 2 sont les variances de l’échantillon pour les groupes 1 et 2, et n 1 et n 2 sont les tailles d’échantillon pour les groupes 1 et 2, respectivement.

Un test t pour échantillons appariés utilise la statistique de test suivante :

statistique de test t = d / (s d / √n)

d est la différence moyenne entre les deux groupes, s d est l’écart type des différences et n est la taille de l’échantillon pour chaque groupe (notez que les deux groupes auront la même taille d’échantillon).

Une ANOVA utilise la statistique de test suivante :

statistique de test F = s 2 b / s 2 w

s 2 b est la variance entre échantillons et s 2 w est la variance au sein de l’échantillon.

Un test t mesure le rapport de la différence moyenne entre deux groupes par rapport à l’écart type global des différences. Si ce ratio est suffisamment élevé, cela prouve suffisamment qu’il existe une différence significative entre les deux groupes.

Une ANOVA, quant à elle, mesure le rapport de variance entre les groupes par rapport à la variance au sein des groupes. À l’instar du test t, si ce rapport est suffisamment élevé, il fournit suffisamment de preuves que les trois groupes n’ont pas la même moyenne.

Une autre différence clé entre un test t et une ANOVA est que le test t peut nous dire si deux groupes ont ou non la même moyenne. Une ANOVA, en revanche, nous indique si trois groupes ont tous la même moyenne, mais elle ne nous indique pas explicitement quels groupes ont des moyennes différentes les unes des autres.

Pour savoir quels groupes diffèrent les uns des autres, il faudrait effectuer des tests post-hoc .

Comprendre quand utiliser chaque test

En pratique, lorsque l’on veut comparer les moyennes de deux groupes , on utilise un test t. Lorsque nous voulons comparer les moyennes de trois groupes ou plus , nous utilisons une ANOVA.

La raison sous-jacente pour laquelle nous n’utilisons pas simplement plusieurs tests t pour comparer les moyennes de trois groupes ou plus remonte à la compréhension du taux d’erreur de type I. Supposons que nous souhaitions comparer les moyennes de trois groupes : le groupe A, le groupe B et le groupe C. Vous pourriez être tenté d’effectuer les trois tests t suivants :

  • Un test t pour comparer la différence de moyennes entre le groupe A et le groupe B
  • Un test t pour comparer la différence de moyennes entre le groupe A et le groupe C
  • Un test t pour comparer la différence de moyennes entre le groupe B et le groupe C

Pour chaque test t, il y a une chance que nous commettions une erreur de type I , qui est la probabilité que nous rejetions l’hypothèse nulle alors qu’elle est réellement vraie. Cette probabilité est généralement de 5 %. Cela signifie que lorsque nous effectuons plusieurs tests t, ce taux d’erreur augmente. Par exemple:

  • La probabilité que nous commettions une erreur de type I avec un seul test t est de 1 – 0,95 = 0,05 .
  • La probabilité que nous commettions une erreur de type I avec deux tests t est de 1 – (0,95 2 ) = 0,0975 .
  • La probabilité que nous commettions une erreur de type I avec deux tests t est de 1 – (0,95 3 ) = 0,1427 .

Ce taux d’erreur est inacceptablement élevé. Heureusement, une ANOVA contrôle ces erreurs de sorte que l’erreur de type I reste à seulement 5 %. Cela nous permet d’être plus sûrs qu’un résultat de test statistiquement significatif est réellement significatif et pas seulement un résultat que nous avons obtenu en effectuant de nombreux tests.

Ainsi, lorsque nous voulons comprendre s’il existe une différence entre les moyennes de trois groupes ou plus, nous devons utiliser une ANOVA afin que nos résultats soient statistiquement valides et fiables.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *