Comment effectuer un test T à deux échantillons en Python
Un test t à deux échantillons est utilisé pour tester si les moyennes de deux populations sont égales ou non.
Ce didacticiel explique comment effectuer un test t à deux échantillons en Python.
Exemple : deux exemples de test t en Python
Les chercheurs veulent savoir si deux espèces végétales différentes ont la même hauteur moyenne. Pour tester cela, ils collectent un échantillon aléatoire simple de 20 plantes de chaque espèce.
Suivez les étapes suivantes pour effectuer un test t à deux échantillons afin de déterminer si les deux espèces de plantes ont la même hauteur.
Étape 1 : Créez les données.
Tout d’abord, nous allons créer deux tableaux pour contenir les mesures de chaque groupe de 20 plantes :
import numpy as np group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12]) group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])
Étape 2 : Effectuez un test t à deux échantillons.
Ensuite, nous utiliserons la fonction ttest_ind() de la bibliothèque scipy.stats pour effectuer un test t à deux exemples, qui utilise la syntaxe suivante :
ttest_ind(a, b, égal_var=Vrai)
où:
- a : un tableau d’exemples d’observations pour le groupe 1
- b : un tableau d’exemples d’observations pour le groupe 2
- égal_var : si vrai, effectuez un test t standard indépendant à 2 échantillons qui suppose des variances de population égales. Si faux, effectuez le test t de Welch , qui ne suppose pas des variances de population égales. C’est vrai par défaut.
Avant d’effectuer le test, nous devons décider si nous supposerons ou non que les deux populations ont des variances égales. En règle générale, nous pouvons supposer que les populations ont des variances égales si le rapport entre la plus grande variance de l’échantillon et la plus petite variance de l’échantillon est inférieur à 4 : 1.
#find variance for each group
print(np.var(group1), np.var(group2))
7.73 12.26
Le rapport entre la plus grande variance de l’échantillon et la plus petite variance de l’échantillon est de 12,26 / 7,73 = 1,586 , ce qui est inférieur à 4. Cela signifie que nous pouvons supposer que les variances de la population sont égales.
Ainsi, nous pouvons procéder à la réalisation du test t à deux échantillons avec des variances égales :
import scipy.stats as stats #perform two sample t-test with equal variances stats.ttest_ind(a=group1, b=group2, equal_var=True) (statistic=-0.6337, pvalue=0.53005)
La statistique du test t est de -0,6337 et la valeur p bilatérale correspondante est de 0,53005 .
Étape 3 : Interprétez les résultats.
Les deux hypothèses pour ce test t particulier à deux échantillons sont les suivantes :
H 0 : µ 1 = µ 2 (les deux moyennes de population sont égales)
H A : µ 1 ≠µ 2 (les deux moyennes de population ne sont pas égales)
Parce que la valeur p de notre test (0,53005) est supérieure à alpha = 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle du test. Nous ne disposons pas de preuves suffisantes pour affirmer que la hauteur moyenne des plantes entre les deux populations est différente.
Ressources additionnelles
Comment effectuer un test T sur un échantillon en Python
Comment effectuer un test T pour échantillons appariés en Python