Comment effectuer un test T pour échantillons appariés en Python



Un test t pour échantillons appariés est utilisé pour comparer les moyennes de deux échantillons lorsque chaque observation dans un échantillon peut être associée à une observation dans l’autre échantillon.

Ce didacticiel explique comment effectuer un test t pour échantillons appariés en Python.

Exemple : test T d’échantillons appariés en Python

Supposons que nous voulions savoir si un certain programme d’études a un impact significatif sur les performances des étudiants à un examen particulier. Pour tester cela, nous demandons à 15 élèves d’une classe de passer un pré-test. Ensuite, nous faisons participer chacun des étudiants au programme d’études pendant deux semaines. Ensuite, les étudiants repassent un test de difficulté similaire.

Pour comparer la différence entre les scores moyens au premier et au deuxième test, nous utilisons un test t pour échantillons appariés car pour chaque élève, son score au premier test peut être associé à son score au deuxième test.

Effectuez les étapes suivantes pour effectuer un test t pour échantillons appariés en Python.

Étape 1 : Créez les données.

Tout d’abord, nous allons créer deux tableaux pour contenir les scores pré et post-test :

pre = [88, 82, 84, 93, 75, 78, 84, 87, 95, 91, 83, 89, 77, 68, 91]
post = [91, 84, 88, 90, 79, 80, 88, 90, 90, 96, 88, 89, 81, 74, 92]

Étape 2 : Effectuer un test T pour échantillons appariés.

Ensuite, nous utiliserons la fonction ttest_rel() de la bibliothèque scipy.stats pour effectuer un test t d’échantillons appariés, qui utilise la syntaxe suivante :

test_rel(a, b)

où:

  • a : un tableau d’échantillons d’observations du groupe 1
  • b : un tableau d’échantillons d’observations du groupe 2

Voici comment utiliser cette fonction dans notre exemple spécifique :

import scipy.stats as stats

#perform the paired samples t-test
stats.ttest_rel(pre, post)

(statistic=-2.9732, pvalue=0.0101)

La statistique du test est de -2,9732 et la valeur p bilatérale correspondante est de 0,0101 .

Étape 3 : Interprétez les résultats.

Dans cet exemple, le test t pour échantillons appariés utilise les hypothèses nulles et alternatives suivantes :

H 0 : Les scores moyens pré-test et post-test sont égaux

H A : Les scores moyens pré-test et post-test ne sont pas égaux

Puisque la valeur p ( 0,0101 ) est inférieure à 0,05, nous rejetons l’hypothèse nulle. Nous disposons de suffisamment de preuves pour affirmer que le véritable score moyen au test est différent pour les étudiants avant et après leur participation au programme d’études.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *