Як виконати критерій левена на рівність дисперсій у r


Багато статистичних тестів (таких як односторонній ANOVA або двосторонній ANOVA ) припускають, що дисперсія між кількома групами однакова.

Одним із способів формально перевірити цю гіпотезу є використання тесту Левена , який перевіряє, чи є рівною дисперсія між двома або більше групами.

Цей тест базується на таких припущеннях:

Нульова гіпотеза (H 0 ) : дисперсія між групами однакова.

Альтернативна гіпотеза ( HA ) : дисперсія між групами неоднакова .

Якщо p-значення тесту менше вибраного рівня значущості, ми можемо відхилити нульову гіпотезу та зробити висновок, що у нас є достатньо доказів, щоб стверджувати, що дисперсія між групами нерівна.

Як виконати тест Левена в R

Щоб виконати тест Levene в R, ми можемо використати функцію leveneTest() із бібліотеки автомобіля , яка використовує такий синтаксис:

leveneTest (змінна відповіді ~ групова змінна, дані = дані)

Як приклад розглянемо наступний кадр даних, який показує, скільки ваги втратили люди за допомогою трьох різних програм схуднення:

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep(c("A", "B", "C"), each = 30 ),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#view first six rows of data frame
head(data)

# program weight_loss
#1 A 2.6900916
#2 A 0.7965260
#3 A 1.1163717
#4 A 1.7185601
#5 A 2.7246234
#6 A 0.6050458

Щоб перевірити, чи однакова дисперсія втрати ваги між цими трьома програмами, ми можемо використати функцію leveneTest() і використовувати 0,05 як рівень значущості:

 #load car package
library (car)

#conduct Levene's Test for equality of variances
leveneTest(weight_loss ~ program, data = data)

#Levene's Test for Homogeneity of Variance (center = median)
# Df F value Pr(>F)  
#group 2 4.1716 0.01862 *
#87                  
#---
#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

P-значення тесту становить 0,01862 , що нижче нашого рівня значущості 0,05.

Таким чином, ми відкидаємо нульову гіпотезу та робимо висновок, що дисперсія між трьома групами неоднакова .

Візуалізуйте відмінності у дисперсіях

Виконуючи тест Левена, ми знаємо, що дисперсії між трьома групами не однакові.

На додаток до виконання цього тесту, ми можемо створити коробкові діаграми, які відображають розподіл втрати ваги для кожної з трьох груп, щоб ми могли візуально зрозуміти, чому тест Левена відхилив нульову гіпотезу про рівність дисперсій.

 boxplot(weight_loss ~ program,
  data = data,
  main = "Weight Loss Distribution by Program",
  xlab = "Program",
  ylab = "Weight Loss",
  col = "steelblue",
  border = "black")

Ми бачимо, що дисперсія у втраті ваги значно вища для учасників програми C, ніж для двох інших програм.

Тому логічно, що тест Левена відхиляє нульову гіпотезу про те, що дисперсії між трьома групами рівні.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати тест Левена в різних статистичних програмах:

Як виконати тест Левена в Excel
Як виконати тест Levene на Python
Як виконати тест Левена в SPSS
Як виконати тест Левена в Stata

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *