Guide complet : Comment interpréter les résultats de l’ANOVA dans SAS
Une ANOVA unidirectionnelle est utilisée pour déterminer s’il existe ou non une différence statistiquement significative entre les moyennes de trois groupes indépendants ou plus.
L’exemple suivant montre comment interpréter les résultats d’une ANOVA unidirectionnelle dans SAS.
Exemple : interpréter les résultats de l’ANOVA dans SAS
Supposons qu’un chercheur recrute 30 étudiants pour participer à une étude. Les étudiants sont assignés au hasard à utiliser l’une des trois méthodes d’étude pour se préparer à un examen.
Les résultats des examens pour chaque étudiant sont présentés ci-dessous :
Nous pouvons utiliser le code suivant pour créer cet ensemble de données dans SAS :
/*create dataset*/
data my_data;
input Method $ Score;
datalines;
A 78
A 81
A 82
A 82
A 85
A 88
A 88
A 90
B 81
B 83
B 83
B 85
B 86
B 88
B 90
B 91
C 84
C 88
C 88
C 89
C 90
C 93
C 95
C 98
;
run;
Ensuite, nous utiliserons proc ANOVA pour effectuer l’ANOVA unidirectionnelle :
/*perform one-way ANOVA*/
proc ANOVA data=my_data;
class Method;
model Score = Method;
means Method / tukey cldiff;
run;
Remarque : Nous avons utilisé l’énoncé des moyennes ainsi que les options tukey et cldiff pour spécifier qu’un test post-hoc de Tukey doit être effectué (avec des intervalles de confiance) si la valeur p globale de l’ANOVA unidirectionnelle est statistiquement significative.
Tout d’abord, nous examinerons le tableau ANOVA dans le résultat :
Voici comment interpréter chaque valeur de la sortie :
Modèle DF : Les degrés de liberté pour la méthode variable. Ceci est calculé comme #groups -1. Dans ce cas, il y avait 3 méthodes d’étude différentes, donc cette valeur est : 3-1 = 2 .
Erreur DF : les degrés de liberté pour les résidus. Ceci est calculé comme #total d’observations – # groupes. Dans ce cas, il y avait 24 observations et 3 groupes, donc cette valeur est : 24-3 = 21 .
Total corrigé : la somme du modèle DF et de l’erreur DF. Cette valeur est 2 + 21 = 23 .
Modèle Somme des carrés : La somme des carrés associée à la méthode variable. Cette valeur est 175,583 .
Erreur de somme des carrés : somme des carrés associée aux résidus ou « erreurs ». Cette valeur est 350,25 .
Somme des carrés corrigés Total : La somme du modèle SS et de l’erreur SS. Cette valeur est 525,833 .
Modèle des carrés moyens : somme moyenne des carrés associée à la méthode . Ceci est calculé comme modèle SS / modèle DF, soit 175,583 / 2 = 87,79 .
Erreur quadratique moyenne : somme moyenne des carrés associée aux résidus. Ceci est calculé comme SS Error / DF Error, qui est 350,25 / 21 = 16,68 .
Valeur F : la statistique F globale du modèle ANOVA. Ceci est calculé comme modèle carré moyen / erreur quadratique moyenne, soit 87,79 / 16,68 = 5,26 .
Pr >F : La valeur p associée à la statistique F avec le numérateur df = 2 et le dénominateur df = 21. Dans ce cas, la valeur p est 0,0140 .
La valeur la plus importante de l’ensemble des résultats est la valeur p, car elle nous indique s’il existe une différence significative dans les valeurs moyennes entre les trois groupes.
Rappelons qu’une ANOVA unidirectionnelle utilise les hypothèses nulles et alternatives suivantes :
- H 0 (hypothèse nulle) : toutes les moyennes des groupes sont égales.
- H A (hypothèse alternative) : Au moins une moyenne de groupe est différente des autres.
Étant donné que la valeur p dans notre tableau ANOVA (0,0140) est inférieure à 0,05, nous rejetons l’hypothèse nulle.
Cela signifie que nous disposons de suffisamment de preuves pour affirmer que la note moyenne à l’examen n’est pas égale entre les trois méthodes d’étude.
Pour déterminer exactement quelles moyennes de groupe sont différentes, nous devons nous référer au tableau final du résultat qui montre les résultats des tests post-hoc de Tukey :
Pour savoir quelles moyennes de groupe sont différentes, nous devons examiner quelles comparaisons par paires ont des étoiles ( *** ) à côté d’elles.
Le tableau montre qu’il existe une différence statistiquement significative dans les résultats moyens aux examens entre le groupe A et le groupe C.
Plus précisément, la différence moyenne des résultats aux examens entre le groupe C et le groupe A est de 6,375 .
L’intervalle de confiance à 95 % pour la différence moyenne est de [1,228, 11,522] .
Il n’y a pas de différences statistiquement significatives entre les moyennes des autres groupes.
Ressources additionnelles
Les didacticiels suivants fournissent des informations supplémentaires sur les modèles ANOVA :
Un guide d’utilisation des tests post-hoc avec ANOVA
Comment effectuer une ANOVA unidirectionnelle dans SAS
Comment effectuer une ANOVA bidirectionnelle dans SAS