Comment analyser les résidus dans un modèle ANOVA
Une ANOVA (« analyse de variance ») est un type de modèle utilisé pour déterminer s’il existe ou non une différence significative entre les moyennes de trois groupes indépendants ou plus.
Chaque fois que nous ajustons un modèle ANOVA à un ensemble de données, il y aura toujours des résidus – ceux-ci représentent la différence entre chaque observation individuelle et la moyenne du groupe d’où provient l’observation.
L’exemple suivant montre comment calculer les résidus pour un modèle ANOVA dans la pratique.
Exemple : Calcul des résidus en ANOVA
Supposons que nous recrutions 90 personnes pour participer à une expérience de perte de poids dans laquelle nous assignons au hasard 30 personnes à suivre le programme A, le programme B ou le programme C pendant un mois.
Nous pouvons effectuer une ANOVA unidirectionnelle pour déterminer s’il existe une différence statistiquement significative entre la perte de poids résultant des trois programmes.
Supposons que nous calculions la perte de poids moyenne des individus participant à chaque programme comme suit :
- Programme A : 1,58 livres
- Programme B : 2,56 livres
- Programme C : 4,13 livres
Les résidus du modèle ANOVA seraient la différence entre la perte de poids de chaque individu et la perte de poids moyenne de son programme.
Par exemple, le tableau suivant montre comment calculer les résidus pour 10 individus différents dans l’étude :
Notez le modèle suivant :
- Les individus qui avaient une valeur supérieure à la moyenne de leur groupe avaient un résidu positif .
- Les individus qui avaient une valeur inférieure à la moyenne de leur groupe avaient un résidu négatif .
En pratique, nous calculerions les résidus pour l’ensemble des 90 individus.
Comment utiliser les résidus pour vérifier la normalité
L’une des hypothèses d’une ANOVA est que les résidus sont normalement distribués.
Le moyen le plus courant de vérifier cette hypothèse consiste à créer un tracé QQ .
Si les résidus sont normalement distribués, alors les points d’un tracé QQ se situeront sur une ligne diagonale droite.
Voici à quoi ressemblerait un tracé QQ pour notre exemple précédent :
Les pointes s’écartent un peu de la ligne diagonale droite aux extrémités de la queue, mais en général les pointes tombent suivent assez bien la ligne diagonale. Cela nous indique que l’hypothèse de normalité est probablement remplie.
À titre de référence, voici à quoi pourrait ressembler un tracé QQ pour les résidus non distribués normalement :
Les points s’écartent énormément de la ligne diagonale droite, ce qui indique que les résidus ne sont pas normalement distribués.
Reportez-vous aux didacticiels suivants pour apprendre à créer des tracés QQ dans différents logiciels :
- Comment créer un tracé QQ dans Excel
- Comment créer un tracé QQ dans R
- Comment créer un tracé QQ en Python
Ressources additionnelles
Les articles suivants fournissent des informations supplémentaires sur les modèles ANOVA :
Une introduction à l’ANOVA unidirectionnelle
Comment vérifier les hypothèses de l’ANOVA
4 exemples d’utilisation de l’ANOVA dans la vie réelle