Як виконати тест співвідношення дисперсії в r (з прикладом)
Тест на відношення дисперсій використовується, щоб перевірити, чи є дві дисперсії сукупності рівними чи ні.
Цей тест використовує такі нульові та альтернативні гіпотези:
- H 0 : Дисперсії популяції рівні
- H A : Дисперсії популяції не однакові
Щоб виконати цей тест, ми обчислюємо таку тестову статистику:
F = s 1 2 / s 2 2
золото:
- s 1 2 : вибіркова дисперсія першої групи
- s 2 2 : Дисперсія вибірки другої групи
Якщо p-значення , яке відповідає цій статистиці F-критерію, нижче певного порогу (наприклад, 0,05), тоді ми відхиляємо нульову гіпотезу та робимо висновок, що дисперсії сукупності не рівні.
Щоб виконати тест співвідношення дисперсії в R, ми можемо використати вбудовану функцію var.test() .
У наступному прикладі показано, як використовувати цю функцію на практиці.
Приклад: перевірка співвідношення дисперсії в R
Припустімо, ми хочемо знати, чи два різні види рослин мають однакову різницю у висоті.
Щоб перевірити це, ми збираємо просту випадкову вибірку з 15 рослин кожного виду.
У наведеному нижче коді показано, як виконати тест співвідношення дисперсії в R, щоб визначити, чи рівна дисперсія висоти між двома видами:
#create vectors to hold plant heights from each sample group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19) group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29) #perform variance ratio test var. test (group1, group2) F test to compare two variances data: group1 and group2 F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1467737 1.3021737 sample estimates: ratio of variances 0.4371783
Ось як інтерпретувати результати тесту:
дані: імена векторів, які містять вибіркові дані.
F: статистика тесту F. У цьому випадку це 0,43718 .
num df, denom df : Ступені свободи чисельника та знаменника для статистики F-тесту, обчислені як n 1 – 1 та n 2 -1 відповідно.
Значення p: Значення p, яке відповідає статистиці F-тесту 0,43718 із чисельником df = 14 і знаменником df = 14. Значення p виявляється рівним 0,1336 .
95% довірчий інтервал: 95% довірчий інтервал для справжнього співвідношення дисперсій між двома групами. Виявляється [.147, 1.302] . Оскільки 1 міститься в цьому інтервалі, вірогідно, що справжнє співвідношення дисперсій дорівнює 1, тобто рівні дисперсії.
вибіркові оцінки: це співвідношення дисперсій між кожною групою. Якщо ми використовуємо функцію var() , ми можемо побачити, що дисперсія вибірки першої групи становить 21,8381, а дисперсія вибірки другої групи – 49,95238. Отже, співвідношення дисперсій становить 21,8381 / 49,95238 = 0,4371783 .
Нагадаємо нульову та альтернативну гіпотези цього тесту:
- H 0 : Дисперсії популяції рівні
- H A : Дисперсії популяції не однакові
Оскільки p-значення нашого тесту (0,1336) не менше 0,05, ми не можемо відхилити нульову гіпотезу.
Це означає, що ми не маємо достатніх доказів, щоб зробити висновок про неоднаковість різниці у висоті рослин між двома видами.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в R:
Як виконати T-тест з одним зразком у R
Як виконати Т-тест Велча в R
Як виконати t-тест парних зразків у R