Comment effectuer un test de rapport de variance dans R (avec exemple)
Un test de rapport de variance est utilisé pour tester si deux variances de population sont égales ou non.
Ce test utilise les hypothèses nulles et alternatives suivantes :
- H 0 : Les variances de population sont égales
- H A : Les variances de population ne sont pas égales
Pour effectuer ce test, nous calculons la statistique de test suivante :
F = s 1 2 / s 2 2
où:
- s 1 2 : La variance d’échantillon du premier groupe
- s 2 2 : La variance d’échantillon du deuxième groupe
Si la valeur p qui correspond à cette statistique de test F est inférieure à un certain seuil (par exemple 0,05), alors nous rejetons l’hypothèse nulle et concluons que les variances de la population ne sont pas égales.
Pour effectuer un test de rapport de variance dans R, nous pouvons utiliser la fonction intégrée var.test() .
L’exemple suivant montre comment utiliser cette fonction dans la pratique.
Exemple : test du rapport de variance dans R
Supposons que nous voulions savoir si deux espèces de plantes différentes ont la même variation de hauteur.
Pour tester cela, nous collectons un échantillon aléatoire simple de 15 plantes de chaque espèce.
Le code suivant montre comment effectuer un test de rapport de variance dans R pour déterminer si la variance en hauteur est égale entre les deux espèces :
#create vectors to hold plant heights from each sample group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19) group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29) #perform variance ratio test var.test(group1, group2) F test to compare two variances data: group1 and group2 F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1467737 1.3021737 sample estimates: ratio of variances 0.4371783
Voici comment interpréter les résultats du test :
data : les noms des vecteurs qui contiennent les exemples de données.
F : La statistique de test F. Dans ce cas, il s’agit de 0,43718 .
num df, denom df : Les degrés de liberté numérateur et dénominateur pour la statistique de test F, calculés comme n 1 – 1 et n 2 -1, respectivement.
Valeur p : La valeur p qui correspond à la statistique de test F de 0,43718 avec le numérateur df = 14 et le dénominateur df = 14. La valeur p s’avère être 0,1336 .
Intervalle de confiance à 95 % : intervalle de confiance à 95 % pour le véritable rapport des variances entre les deux groupes. Il s’avère que c’est [.147, 1.302] . Puisque 1 est contenu dans cet intervalle, il est plausible que le véritable rapport des variances soit de 1, c’est-à-dire des variances égales.
estimations par échantillon : cela représente le rapport des variances entre chaque groupe. Si nous utilisons la fonction var() , nous pouvons constater que la variance d’échantillon du premier groupe est de 21,8381 et la variance d’échantillon du deuxième groupe est de 49,95238. Ainsi, le rapport des variances est 21,8381 / 49,95238 = 0,4371783 .
Rappelons les hypothèses nulles et alternatives de ce test :
- H 0 : Les variances de population sont égales
- H A : Les variances de population ne sont pas égales
Étant donné que la valeur p de notre test (0,1336) n’est pas inférieure à 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle.
Cela signifie que nous ne disposons pas de preuves suffisantes pour conclure que la variance de la hauteur des plantes entre les deux espèces est inégale.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment effectuer un test T sur un échantillon dans R
Comment effectuer le test T de Welch dans R
Comment effectuer un test T pour échantillons appariés dans R