Jak wykonać test levene’a na równość wariancji w r


Wiele testów statystycznych (takich jak jednokierunkowa ANOVA lub dwukierunkowa ANOVA ) zakłada, że wariancja między wieloma grupami jest równa.

Jednym ze sposobów formalnego sprawdzenia tej hipotezy jest użycie testu Levene’a , który sprawdza, czy wariancja między dwiema lub większą liczbą grup jest równa.

Test ten opiera się na następujących założeniach:

Hipoteza zerowa (H 0 ) : Wariancja pomiędzy grupami jest równa.

Hipoteza alternatywna ( HA ) : Wariancja pomiędzy grupami nie jest równa.

Jeżeli wartość p testu jest mniejsza niż wybrany poziom istotności, możemy odrzucić hipotezę zerową i stwierdzić, że mamy wystarczające dowody, aby stwierdzić, że wariancja między grupami nie jest równa.

Jak wykonać test Levene’a w R

Aby wykonać test Levene’a w R, możemy skorzystać z funkcji leveneTest() z biblioteki car , która wykorzystuje następującą składnię:

leveneTest (zmienna odpowiedzi ~ zmienna grupowa, dane = dane)

Jako przykład rozważ poniższą ramkę danych, która pokazuje, ile kilogramów stracili ludzie dzięki trzem różnym programom odchudzania:

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep(c("A", "B", "C"), each = 30 ),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#view first six rows of data frame
head(data)

# program weight_loss
#1 A 2.6900916
#2 A 0.7965260
#3 A 1.1163717
#4 A 1.7185601
#5 A 2.7246234
#6 A 0.6050458

Aby sprawdzić, czy wariancja utraty wagi jest równa pomiędzy tymi trzema programami, możemy użyć funkcji leveneTest() i przyjąć 0,05 jako poziom istotności:

 #load car package
library (car)

#conduct Levene's Test for equality of variances
leveneTest(weight_loss ~ program, data = data)

#Levene's Test for Homogeneity of Variance (center = median)
# Df F value Pr(>F)  
#group 2 4.1716 0.01862 *
#87                  
#---
#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Wartość p testu wynosi 0,01862 , czyli jest poniżej naszego poziomu istotności wynoszącego 0,05.

Zatem odrzucamy hipotezę zerową i stwierdzamy, że wariancja pomiędzy trzema grupami nie jest równa.

Wizualizuj różnice w wariancjach

Wykonując test Levene’a wiemy, że wariancje pomiędzy trzema grupami nie są równe.

Oprócz wykonania tego testu możemy utworzyć wykresy pudełkowe przedstawiające rozkład utraty masy ciała dla każdej z trzech grup, abyśmy mogli wizualnie zrozumieć, dlaczego test Levene’a odrzucił hipotezę zerową o równości wariancji.

 boxplot(weight_loss ~ program,
  data = data,
  main = "Weight Loss Distribution by Program",
  xlab = "Program",
  ylab = "Weight Loss",
  col = "steelblue",
  border = "black")

Widzimy, że różnica w utracie wagi jest znacznie większa w przypadku uczestników programu C niż w przypadku pozostałych dwóch programów.

Logiczne jest zatem, że test Levene’a odrzuca hipotezę zerową, że wariancje są równe pomiędzy trzema grupami.

Dodatkowe zasoby

Poniższe tutoriale wyjaśniają, jak przeprowadzić test Levene’a w różnych programach statystycznych:

Jak wykonać test Levene’a w programie Excel
Jak wykonać test Levene’a w Pythonie
Jak wykonać test Levene’a w SPSS
Jak wykonać test Levene’a w Stata

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *