Comment effectuer un test de rapport de variance dans R (avec exemple)



Un test de rapport de variance est utilisé pour tester si deux variances de population sont égales ou non.

Ce test utilise les hypothèses nulles et alternatives suivantes :

  • H 0 : Les variances de population sont égales
  • H A : Les variances de population ne sont pas égales

Pour effectuer ce test, nous calculons la statistique de test suivante :

F = s 1 2 / s 2 2

où:

  • s 1 2 : La variance d’échantillon du premier groupe
  • s 2 2 : La variance d’échantillon du deuxième groupe

Si la valeur p qui correspond à cette statistique de test F est inférieure à un certain seuil (par exemple 0,05), alors nous rejetons l’hypothèse nulle et concluons que les variances de la population ne sont pas égales.

Pour effectuer un test de rapport de variance dans R, nous pouvons utiliser la fonction intégrée var.test() .

L’exemple suivant montre comment utiliser cette fonction dans la pratique.

Exemple : test du rapport de variance dans R

Supposons que nous voulions savoir si deux espèces de plantes différentes ont la même variation de hauteur.

Pour tester cela, nous collectons un échantillon aléatoire simple de 15 plantes de chaque espèce.

Le code suivant montre comment effectuer un test de rapport de variance dans R pour déterminer si la variance en hauteur est égale entre les deux espèces :

#create vectors to hold plant heights from each sample
group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19)
group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29)

#perform variance ratio test
var.test(group1, group2)

	F test to compare two variances

data:  group1 and group2
F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.1467737 1.3021737
sample estimates:
ratio of variances 
         0.4371783 

Voici comment interpréter les résultats du test :

data : les noms des vecteurs qui contiennent les exemples de données.

F : La statistique de test F. Dans ce cas, il s’agit de 0,43718 .

num df, denom df : Les degrés de liberté numérateur et dénominateur pour la statistique de test F, calculés comme n 1 – 1 et n 2 -1, respectivement.

Valeur p : La valeur p qui correspond à la statistique de test F de 0,43718 avec le numérateur df = 14 et le dénominateur df = 14. La valeur p s’avère être 0,1336 .

Intervalle de confiance à 95 % : intervalle de confiance à 95 % pour le véritable rapport des variances entre les deux groupes. Il s’avère que c’est [.147, 1.302] . Puisque 1 est contenu dans cet intervalle, il est plausible que le véritable rapport des variances soit de 1, c’est-à-dire des variances égales.

estimations par échantillon : cela représente le rapport des variances entre chaque groupe. Si nous utilisons la fonction var() , nous pouvons constater que la variance d’échantillon du premier groupe est de 21,8381 et la variance d’échantillon du deuxième groupe est de 49,95238. Ainsi, le rapport des variances est 21,8381 / 49,95238 = 0,4371783 .

Rappelons les hypothèses nulles et alternatives de ce test :

  • H 0 : Les variances de population sont égales
  • H A : Les variances de population ne sont pas égales

Étant donné que la valeur p de notre test (0,1336) n’est pas inférieure à 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle.

Cela signifie que nous ne disposons pas de preuves suffisantes pour conclure que la variance de la hauteur des plantes entre les deux espèces est inégale.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment effectuer un test T sur un échantillon dans R
Comment effectuer le test T de Welch dans R
Comment effectuer un test T pour échantillons appariés dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *