Hoe de levene's test voor gelijkheid van varianties in r uit te voeren
Veel statistische tests (zoals een eenrichtings-ANOVA of een tweerichtings-ANOVA ) gaan ervan uit dat de variantie tussen meerdere groepen gelijk is.
Eén manier om deze hypothese formeel te testen is door de Levene-test te gebruiken, die test of de variantie tussen twee of meer groepen al dan niet gelijk is.
Deze test is gebaseerd op de volgende aannames:
Nulhypothese (H 0 ) : De variantie tussen groepen is gelijk.
Alternatieve hypothese ( HA ) : De variantie tussen groepen is niet gelijk.
Als de p-waarde van de test kleiner is dan het gekozen significantieniveau, kunnen we de nulhypothese verwerpen en concluderen dat we voldoende bewijs hebben om te zeggen dat de variantie tussen groepen niet gelijk is.
Hoe de Levene’s test uit te voeren in R
Om de Levene-test in R uit te voeren, kunnen we de functie leveneTest() uit de autobibliotheek gebruiken, die de volgende syntaxis gebruikt:
leveneTest (responsvariabele ~ groepsvariabele, data = data)
Beschouw als voorbeeld het volgende gegevensframe dat laat zien hoeveel gewicht mensen verloren met drie verschillende programma’s voor gewichtsverlies:
#make this example reproducible set. seeds (0) #create data frame data <- data. frame (program = rep(c("A", "B", "C"), each = 30 ), weight_loss = c(runif(30, 0, 3), runif(30, 0, 5), runif(30, 1, 7))) #view first six rows of data frame head(data) # program weight_loss #1 A 2.6900916 #2 A 0.7965260 #3 A 1.1163717 #4 A 1.7185601 #5 A 2.7246234 #6 A 0.6050458
Om te controleren of de variantie van het gewichtsverlies gelijk is tussen deze drie programma’s, kunnen we de functie leveneTest() gebruiken en 0,05 als significantieniveau gebruiken:
#load car package library (car) #conduct Levene's Test for equality of variances leveneTest(weight_loss ~ program, data = data) #Levene's Test for Homogeneity of Variance (center = median) # Df F value Pr(>F) #group 2 4.1716 0.01862 * #87 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De p-waarde van de test is 0,01862 , wat onder ons significantieniveau van 0,05 ligt.
We verwerpen dus de nulhypothese en concluderen dat de variantie tussen de drie groepen niet gelijk is.
Visualiseer de verschillen in varianties
Door de Levene-test uit te voeren weten we dat de varianties tussen de drie groepen niet gelijk zijn.
Naast het uitvoeren van deze test kunnen we boxplots maken die de verdeling van het gewichtsverlies voor elk van de drie groepen weergeven, zodat we visueel kunnen begrijpen waarom Levene’s test de nulhypothese van gelijkheid van varianties verwierp.
boxplot(weight_loss ~ program, data = data, main = "Weight Loss Distribution by Program", xlab = "Program", ylab = "Weight Loss", col = "steelblue", border = "black")
We kunnen zien dat de variantie in gewichtsverlies aanzienlijk groter is voor deelnemers aan programma C dan voor de andere twee programma’s.
Het is daarom logisch dat Levene’s test de nulhypothese verwerpt dat de varianties tussen de drie groepen gelijk zijn.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u de Levene-test uitvoert in verschillende statistische software:
Hoe de Levene-test uit te voeren in Excel
Hoe de Levene-test in Python uit te voeren
Hoe u de Levene-test uitvoert in SPSS
Hoe de Levene-test uit te voeren in Stata