Comment effectuer manuellement une ANOVA unidirectionnelle
Une ANOVA unidirectionnelle (« analyse de variance ») compare les moyennes de trois groupes indépendants ou plus pour déterminer s’il existe une différence statistiquement significative entre les moyennes de la population correspondante.
Ce didacticiel explique comment effectuer manuellement une ANOVA unidirectionnelle.
Exemple : ANOVA unidirectionnelle manuelle
Supposons que nous voulions savoir si trois programmes de préparation aux examens différents conduisent ou non à des notes moyennes différentes à un examen donné. Pour tester cela, nous recrutons 30 étudiants pour participer à une étude et les répartissons en trois groupes.
Les étudiants de chaque groupe sont assignés au hasard à utiliser l’un des trois programmes de préparation aux examens pendant les trois semaines suivantes pour se préparer à un examen. A la fin des trois semaines, tous les étudiants passent le même examen.
Les résultats des examens pour chaque groupe sont indiqués ci-dessous :
Suivez les étapes suivantes pour effectuer manuellement une ANOVA unidirectionnelle afin de déterminer si le score moyen à l’examen est différent entre les trois groupes :
Étape 1 : Calculez la moyenne du groupe et la moyenne globale.
Tout d’abord, nous calculerons la moyenne des trois groupes ainsi que la moyenne globale :
Étape 2 : Calculez le SSR.
Ensuite, nous calculerons la somme des carrés de régression (SSR) en utilisant la formule suivante :
nΣ(X j – X ..) 2
où:
- n : la taille de l’échantillon du groupe j
- Σ : un symbole grec qui signifie « somme »
- X j : la moyenne du groupe j
- X .. : la moyenne globale
Dans notre exemple, nous calculons que SSR = 10(83,4-85,8) 2 + 10(89,3-85,8) 2 + 10(84,7-85,8) 2 = 192,2
Étape 3 : Calculez le SSE.
Ensuite, nous calculerons la somme des carrés d’erreur (SSE) en utilisant la formule suivante :
Σ(X ij – X j ) 2
où:
- Σ : un symbole grec qui signifie « somme »
- X ij : la ième observation du groupe j
- X j : la moyenne du groupe j
Dans notre exemple, nous calculons le SSE comme suit :
Groupe 1 : (85-83,4) 2 + (86-83,4) 2 + (88-83.4) 2 + (75-83.4) 2 + (78-83.4) 2 + (94-83.4) 2 + (98-83.4) 2 + (79-83.4) 2 + (71-83.4) 2 + (80-83,4) 2 = 640,4
Groupe 2 : (91-89,3) 2 + (92-89,3) 2 + (93-89.3) 2 + (85-89,3) 2 + (87-89.3) 2 + (84-89.3) 2 + (82-89.3) 2 + (88-89.3) 2 + (95-89.3) 2 + (96-89,3) 2 = 208,1
Groupe 3 : (79-84,7) 2 + (78-84,7) 2 + (88-84.7) 2 + (94-84.7) 2 + (92-84.7) 2 + (85-84,7) 2 + (83-84.7) 2 + (85-84,7) 2 + (82-84.7) 2 + (81-84,7) 2 = 252,1
ESS : 640,4 + 208,1 + 252,1 = 1 100,6
Étape 4 : Calculez la SST.
Ensuite, nous calculerons la somme totale des carrés (SST) en utilisant la formule suivante :
SST = SSR + SSE
Dans notre exemple, SST = 192,2 + 1100,6 = 1292,8
Étape 5 : Remplissez le tableau ANOVA.
Maintenant que nous avons SSR, SSE et SST, nous pouvons remplir le tableau ANOVA :
Source | Somme des carrés (SS) | df | Carrés moyens (MS) | F |
---|---|---|---|---|
Traitement | 192.2 | 2 | 96.1 | 2.358 |
Erreur | 1100,6 | 27 | 40,8 | |
Total | 1292.8 | 29 |
Voici comment nous avons calculé les différents nombres du tableau :
- traitement df : k-1 = 3-1 = 2
- erreur df : nk = 30-3 = 27
- df total : n-1 = 30-1 = 29
- Traitement SEP : traitement SST / df = 192,2 / 2 = 96,1
- Erreur MS : erreur SSE / df = 1100,6 / 27 = 40,8
- F : traitement MS / erreur MS = 96,1 / 40,8 = 2,358
Remarque : n = nombre total d’observations, k = nombre de groupes
Étape 6 : Interprétez les résultats.
La statistique du test F pour cette ANOVA unidirectionnelle est de 2,358 . Pour déterminer s’il s’agit d’un résultat statistiquement significatif, nous devons le comparer à la valeur critique F trouvée dans le tableau de distribution F avec les valeurs suivantes :
- α (niveau de signification) = 0,05
- DF1 (degrés de liberté du numérateur) = df traitement = 2
- DF2 (degrés de liberté du dénominateur) = erreur df = 27
Nous trouvons que la valeur critique de F est de 3,3541 .
Étant donné que la statistique du test F dans le tableau ANOVA est inférieure à la valeur critique F dans le tableau de distribution F, nous ne parvenons pas à rejeter l’hypothèse nulle. Cela signifie que nous ne disposons pas de preuves suffisantes pour affirmer qu’il existe une différence statistiquement significative entre les résultats moyens aux examens des trois groupes.
Ressource bonus : utilisez ce calculateur d’ANOVA unidirectionnelle pour effectuer automatiquement une ANOVA unidirectionnelle pour un maximum de cinq échantillons.