Test T de Welch : quand l’utiliser + exemples
Lorsque l’on souhaite comparer les moyennes de deux groupes indépendants, on peut choisir entre utiliser deux tests différents :
Test t de Student : ce test suppose que les deux groupes de données sont échantillonnés à partir de populations qui suivent unedistribution normale et que les deux populations ont la même variance.
Test t de Welch : ce test suppose que les deux groupes de données sont échantillonnés à partir de populations qui suivent une distribution normale, mais il ne suppose pas que ces deux populations ont la même variance .
La différence entre le test t de Student et le test t de Welch
Il existe deux différences dans la manière dont le test t de Student et le test t de Welch sont effectués :
- La statistique du test
- Les degrés de liberté
Test t de Student :
Statistique de test : ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
où x 1 et x 2 sont les moyennes de l’échantillon, n 1 et n 2 sont les tailles d’échantillon pour l’échantillon 1 et l’échantillon 2, respectivement, et où s p est calculé comme suit :
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
où s 1 2 et s 2 2 sont les variances de l’échantillon.
Degrés de liberté : n 1 + n 2 – 2
Test T de Welch
Statistique de test : ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Degrés de liberté : (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
La formule permettant de calculer les degrés de liberté pour le test t de Welch prend en compte la différence entre les deux écarts types. Si les deux échantillons ont les mêmes écarts types, alors les degrés de liberté du test t de Welch seront exactement les mêmes que les degrés de liberté du test t de Student.
En règle générale, les écarts types pour les deux échantillons ne sont pas les mêmes et les degrés de liberté du test t de Welch ont donc tendance à être plus petits que les degrés de liberté du test t de Student.
Il est également important de noter que les degrés de liberté du test t de Welch ne sont généralement pas un nombre entier. Si vous effectuez le test manuellement, il est préférable d’arrondir au nombre entier le plus bas. Si vous utilisez un logiciel statistique comme R , le logiciel pourra fournir la valeur décimale des degrés de liberté.
Quand devriez-vous utiliser le test t de Welch ?
Certaines personnes soutiennent que le test t de Welch devrait être le choix par défaut pour comparer les moyennes de deux groupes indépendants, car il donne de meilleurs résultats que le test t de Student lorsque la taille des échantillons et les variances sont inégales entre les groupes, et il donne des résultats identiques lorsque la taille des échantillons est différente. les écarts sont égaux.
En pratique, lorsque vous comparez les moyennes de deux groupes, il est peu probable que les écarts types de chaque groupe soient identiques. C’est donc une bonne idée de toujours utiliser le test t de Welch, afin de ne pas avoir à faire d’hypothèses sur l’égalité des variances.
Exemples d’utilisation du test t de Welch
Ensuite, nous effectuerons le test t de Welch sur les deux échantillons suivants pour déterminer si les moyennes de leurs populations diffèrent significativement à un niveau de signification de 0,05 :
Échantillon 1 : 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
Échantillon 2 : 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
Nous allons illustrer comment effectuer le test de trois manières différentes :
- Par la main
- Utiliser Microsoft Excel
- Utiliser le langage de programmation statistique R
Test T de Welch à la main
Pour effectuer le test t de Welch à la main, nous devons d’abord trouver les moyennes de l’échantillon, les variances de l’échantillon et la taille des échantillons :
x1 – 19.27
x2 – 23,69
s 1 2 – 20h42
art 2 2 – 83.23
n 1 – 11
n 2 – 13
Ensuite, nous pouvons saisir ces chiffres pour trouver la statistique du test :
Statistique de test : ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Statistique de test : (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538
Degrés de liberté : (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Degrés de liberté : (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Nous arrondissons ce résultat à l’entier le plus proche, 18 .
Enfin, nous retrouverons la valeur critique t dans le tableau de distribution t qui correspond à un test bilatéral avec alpha = 0,05 pour 18 degrés de liberté :
La valeur critique t est 2,101 . Puisque la valeur absolue de notre statistique de test (1,538) n’est pas supérieure à la valeur critique t, nous ne parvenons pas à rejeter l’hypothèse nulle du test. Il n’existe pas suffisamment de preuves pour affirmer que les moyens des deux populations sont significativement différents.
Test T de Welch avec Excel
Pour effectuer le test t de Welch dans Excel, nous devons d’abord télécharger le logiciel gratuit Analysis ToolPak. Si vous ne l’avez pas déjà téléchargé dans Excel, j’ai rédigé un tutoriel rapide sur la façon de le télécharger .
Une fois que vous avez téléchargé Analysis ToolPak, vous pouvez suivre les étapes ci-dessous pour effectuer le test t de Welch sur nos deux échantillons :
1. Saisissez les données. Entrez les valeurs des données pour les deux échantillons dans les colonnes A et B ainsi que les en-têtes Échantillon 1 et Échantillon 2 dans la première cellule de chaque colonne.
2. Effectuez le test t de Welch à l’aide d’Analysis ToolPak. Accédez à l’onglet Données le long du ruban supérieur. Ensuite, sous le groupe Analyse , cliquez sur l’icône du ToolPak d’analyse.
Dans la boîte de dialogue qui apparaît, cliquez sur Test t : deux échantillons supposant des variances inégales , puis cliquez sur OK.
Enfin, remplissez les valeurs ci-dessous puis cliquez sur OK :
Le résultat suivant devrait apparaître :
Notez que les résultats de ce test correspondent aux résultats que nous avons obtenus manuellement :
- La statistique du test est de -1,5379 .
- La valeur critique bilatérale est 2,1009 .
- Puisque la valeur absolue de la statistique de test n’est pas supérieure à la valeur critique bilatérale, les moyennes des deux populations ne sont pas statistiquement différentes.
- En outre, la valeur p bilatérale du test est de 0,14, ce qui est supérieur à 0,05 et confirme que les moyennes des deux populations ne sont pas statistiquement différentes.
Test t de Welch utilisant R
Le code suivant illustre comment effectuer le test t de Welch pour nos deux échantillons à l’aide du langage de programmation statistique R :
#create two vectors to hold sample data values sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25) sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34) #conduct Welch's test t.test(sample1, sample2) # Welch Two Sample t-test # #data: sample1 and sample2 #t = -1.5379, df = 18.137, p-value = 0.1413 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: # -10.453875 1.614714 #sample estimates: #mean of x mean of y # 19.27273 23.69231 #
La fonction t.test() affiche la sortie pertinente suivante :
- t : la statistique du test = -1,5379
- df : les degrés de liberté = 18,137
- Valeur p : la valeur p du test bilatéral = 0,1413
- Intervalle de confiance à 95 % : l’ intervalle de confiance à 95 % pour la vraie différence dans les moyennes de la population = (-10,45, 1,61)
Les résultats de ce test correspondent à ceux obtenus manuellement et à l’aide d’Excel : la différence de moyenne pour ces deux populations n’est pas statistiquement significative au niveau d’alpha = 0,05.