Jak wykonać test levene’a na równość wariancji w r
Wiele testów statystycznych (takich jak jednokierunkowa ANOVA lub dwukierunkowa ANOVA ) zakłada, że wariancja między wieloma grupami jest równa.
Jednym ze sposobów formalnego sprawdzenia tej hipotezy jest użycie testu Levene’a , który sprawdza, czy wariancja między dwiema lub większą liczbą grup jest równa.
Test ten opiera się na następujących założeniach:
Hipoteza zerowa (H 0 ) : Wariancja pomiędzy grupami jest równa.
Hipoteza alternatywna ( HA ) : Wariancja pomiędzy grupami nie jest równa.
Jeżeli wartość p testu jest mniejsza niż wybrany poziom istotności, możemy odrzucić hipotezę zerową i stwierdzić, że mamy wystarczające dowody, aby stwierdzić, że wariancja między grupami nie jest równa.
Jak wykonać test Levene’a w R
Aby wykonać test Levene’a w R, możemy skorzystać z funkcji leveneTest() z biblioteki car , która wykorzystuje następującą składnię:
leveneTest (zmienna odpowiedzi ~ zmienna grupowa, dane = dane)
Jako przykład rozważ poniższą ramkę danych, która pokazuje, ile kilogramów stracili ludzie dzięki trzem różnym programom odchudzania:
#make this example reproducible set. seeds (0) #create data frame data <- data. frame (program = rep(c("A", "B", "C"), each = 30 ), weight_loss = c(runif(30, 0, 3), runif(30, 0, 5), runif(30, 1, 7))) #view first six rows of data frame head(data) # program weight_loss #1 A 2.6900916 #2 A 0.7965260 #3 A 1.1163717 #4 A 1.7185601 #5 A 2.7246234 #6 A 0.6050458
Aby sprawdzić, czy wariancja utraty wagi jest równa pomiędzy tymi trzema programami, możemy użyć funkcji leveneTest() i przyjąć 0,05 jako poziom istotności:
#load car package library (car) #conduct Levene's Test for equality of variances leveneTest(weight_loss ~ program, data = data) #Levene's Test for Homogeneity of Variance (center = median) # Df F value Pr(>F) #group 2 4.1716 0.01862 * #87 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Wartość p testu wynosi 0,01862 , czyli jest poniżej naszego poziomu istotności wynoszącego 0,05.
Zatem odrzucamy hipotezę zerową i stwierdzamy, że wariancja pomiędzy trzema grupami nie jest równa.
Wizualizuj różnice w wariancjach
Wykonując test Levene’a wiemy, że wariancje pomiędzy trzema grupami nie są równe.
Oprócz wykonania tego testu możemy utworzyć wykresy pudełkowe przedstawiające rozkład utraty masy ciała dla każdej z trzech grup, abyśmy mogli wizualnie zrozumieć, dlaczego test Levene’a odrzucił hipotezę zerową o równości wariancji.
boxplot(weight_loss ~ program, data = data, main = "Weight Loss Distribution by Program", xlab = "Program", ylab = "Weight Loss", col = "steelblue", border = "black")
Widzimy, że różnica w utracie wagi jest znacznie większa w przypadku uczestników programu C niż w przypadku pozostałych dwóch programów.
Logiczne jest zatem, że test Levene’a odrzuca hipotezę zerową, że wariancje są równe pomiędzy trzema grupami.
Dodatkowe zasoby
Poniższe tutoriale wyjaśniają, jak przeprowadzić test Levene’a w różnych programach statystycznych:
Jak wykonać test Levene’a w programie Excel
Jak wykonać test Levene’a w Pythonie
Jak wykonać test Levene’a w SPSS
Jak wykonać test Levene’a w Stata