Comment effectuer une ANOVA à mesures répétées en Python
Une ANOVA à mesures répétées est utilisée pour déterminer s’il existe ou non une différence statistiquement significative entre les moyennes de trois groupes ou plus dans lesquels les mêmes sujets apparaissent dans chaque groupe.
Ce didacticiel explique comment effectuer une ANOVA à mesures répétées unidirectionnelles en Python.
Exemple : ANOVA à mesures répétées en Python
Les chercheurs veulent savoir si quatre médicaments différents entraînent des temps de réaction différents. Pour tester cela, ils mesurent le temps de réaction de cinq patients aux quatre médicaments différents.
Puisque chaque patient est mesuré sur chacun des quatre médicaments, nous utiliserons une ANOVA à mesures répétées pour déterminer si le temps de réaction moyen diffère entre les médicaments.
Utilisez les étapes suivantes pour effectuer l’ANOVA à mesures répétées en Python.
Étape 1 : Saisissez les données.
Tout d’abord, nous allons créer un DataFrame pandas pour contenir nos données :
import numpy as np import pandas as pd #create data df = pd.DataFrame({'patient': np.repeat([1, 2, 3, 4, 5], 4), 'drug': np.tile([1, 2, 3, 4], 5), 'response': [30, 28, 16, 34, 14, 18, 10, 22, 24, 20, 18, 30, 38, 34, 20, 44, 26, 28, 14, 30]}) #view first ten rows of data df.head[:10] patient drug response 0 1 1 30 1 1 2 28 2 1 3 16 3 1 4 34 4 2 1 14 5 2 2 18 6 2 3 10 7 2 4 22 8 3 1 24 9 3 2 20
Étape 2 : Effectuez l’ANOVA à mesures répétées.
Ensuite, nous effectuerons l’ANOVA à mesures répétées en utilisant la fonction AnovaRM() de la bibliothèque statsmodels :
from statsmodels.stats.anova import AnovaRM #perform the repeated measures ANOVA print(AnovaRM(data=df, depvar='response', subject='patient', within=['drug']).fit()) Anova ================================== F Value Num DF Den DF Pr > F ---------------------------------- drug 24.7589 3.0000 12.0000 0.0000 ==================================
Étape 3 : Interprétez les résultats.
Une ANOVA à mesures répétées utilise les hypothèses nulles et alternatives suivantes :
L’hypothèse nulle (H 0 ) : µ 1 = µ 2 = µ 3 (les moyennes de population sont toutes égales)
L’hypothèse alternative : (Ha) : au moins une moyenne de population est différente du reste
Dans cet exemple, la statistique de test F est 24,7589 et la valeur p correspondante est 0,0000 .
Puisque cette valeur p est inférieure à 0,05, nous rejetons l’hypothèse nulle et concluons qu’il existe une différence statistiquement significative dans les temps de réponse moyens entre les quatre médicaments.
Étape 4 : Rapportez les résultats.
Enfin, nous rapporterons les résultats de notre ANOVA à mesures répétées. Voici un exemple de la façon de procéder :
Une ANOVA unidirectionnelle à mesures répétées a été réalisée sur 5 personnes pour examiner l’effet de quatre médicaments différents sur le temps de réponse.
Les résultats ont montré que le type de médicament utilisé entraînait des différences statistiquement significatives dans le temps de réponse (F (3, 12) = 24,75887, p < 0,001).
Ressources additionnelles
Les didacticiels suivants fournissent des informations supplémentaires sur les ANOVA à mesures répétées :
ANOVA unidirectionnelle et ANOVA à mesures répétées : la différence
Comment effectuer manuellement une ANOVA à mesures répétées
Les trois hypothèses de l’ANOVA à mesures répétées