Як виконати тест співвідношення дисперсії в r (з прикладом)


Тест на відношення дисперсій використовується, щоб перевірити, чи є дві дисперсії сукупності рівними чи ні.

Цей тест використовує такі нульові та альтернативні гіпотези:

  • H 0 : Дисперсії популяції рівні
  • H A : Дисперсії популяції не однакові

Щоб виконати цей тест, ми обчислюємо таку тестову статистику:

F = s 1 2 / s 2 2

золото:

  • s 1 2 : вибіркова дисперсія першої групи
  • s 2 2 : Дисперсія вибірки другої групи

Якщо p-значення , яке відповідає цій статистиці F-критерію, нижче певного порогу (наприклад, 0,05), тоді ми відхиляємо нульову гіпотезу та робимо висновок, що дисперсії сукупності не рівні.

Щоб виконати тест співвідношення дисперсії в R, ми можемо використати вбудовану функцію var.test() .

У наступному прикладі показано, як використовувати цю функцію на практиці.

Приклад: перевірка співвідношення дисперсії в R

Припустімо, ми хочемо знати, чи два різні види рослин мають однакову різницю у висоті.

Щоб перевірити це, ми збираємо просту випадкову вибірку з 15 рослин кожного виду.

У наведеному нижче коді показано, як виконати тест співвідношення дисперсії в R, щоб визначити, чи рівна дисперсія висоти між двома видами:

 #create vectors to hold plant heights from each sample
group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19)
group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29)

#perform variance ratio test
var. test (group1, group2)

	F test to compare two variances

data: group1 and group2
F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.1467737 1.3021737
sample estimates:
ratio of variances 
         0.4371783

Ось як інтерпретувати результати тесту:

дані: імена векторів, які містять вибіркові дані.

F: статистика тесту F. У цьому випадку це 0,43718 .

num df, denom df : Ступені свободи чисельника та знаменника для статистики F-тесту, обчислені як n 1 – 1 та n 2 -1 відповідно.

Значення p: Значення p, яке відповідає статистиці F-тесту 0,43718 із чисельником df = 14 і знаменником df = 14. Значення p виявляється рівним 0,1336 .

95% довірчий інтервал: 95% довірчий інтервал для справжнього співвідношення дисперсій між двома групами. Виявляється [.147, 1.302] . Оскільки 1 міститься в цьому інтервалі, вірогідно, що справжнє співвідношення дисперсій дорівнює 1, тобто рівні дисперсії.

вибіркові оцінки: це співвідношення дисперсій між кожною групою. Якщо ми використовуємо функцію var() , ми можемо побачити, що дисперсія вибірки першої групи становить 21,8381, а дисперсія вибірки другої групи – 49,95238. Отже, співвідношення дисперсій становить 21,8381 / 49,95238 = 0,4371783 .

Нагадаємо нульову та альтернативну гіпотези цього тесту:

  • H 0 : Дисперсії популяції рівні
  • H A : Дисперсії популяції не однакові

Оскільки p-значення нашого тесту (0,1336) не менше 0,05, ми не можемо відхилити нульову гіпотезу.

Це означає, що ми не маємо достатніх доказів, щоб зробити висновок про неоднаковість різниці у висоті рослин між двома видами.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в R:

Як виконати T-тест з одним зразком у R
Як виконати Т-тест Велча в R
Як виконати t-тест парних зразків у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *