Как выполнить тест на коэффициент дисперсии в r (с примером)
Тест отношения дисперсии используется для проверки того, равны ли две дисперсии генеральной совокупности.
В этом тесте используются следующие нулевые и альтернативные гипотезы:
- H 0 : Отклонения генеральной совокупности равны
- H A : Отклонения генеральной совокупности не равны.
Для выполнения этого теста мы вычисляем следующую статистику теста:
F = с 1 2 / с 2 2
Золото:
- s 1 2 : Выборочная дисперсия первой группы.
- s 2 2 : Выборочная дисперсия второй группы.
Если значение p , соответствующее этой статистике F-теста, ниже определенного порога (например, 0,05), то мы отвергаем нулевую гипотезу и делаем вывод, что дисперсии генеральной совокупности не равны.
Чтобы выполнить тест коэффициента дисперсии в R, мы можем использовать встроенную функцию var.test() .
В следующем примере показано, как использовать эту функцию на практике.
Пример: проверка коэффициента дисперсии в R
Предположим, мы хотим знать, имеют ли два разных вида растений одинаковые различия в высоте.
Чтобы проверить это, мы собираем простую случайную выборку из 15 растений каждого вида.
Следующий код показывает, как выполнить тест коэффициента дисперсии в R, чтобы определить, одинакова ли разница по высоте между двумя видами:
#create vectors to hold plant heights from each sample group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19) group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29) #perform variance ratio test var. test (group1, group2) F test to compare two variances data: group1 and group2 F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1467737 1.3021737 sample estimates: ratio of variances 0.4371783
Вот как интерпретировать результаты теста:
данные: имена векторов, содержащих образцы данных.
F: Статистика F-теста. В данном случае это 0,43718 .
num df, denom df : степени свободы в числителе и знаменателе для статистики F-теста, рассчитываемые как n 1 – 1 и n 2 -1 соответственно.
Значение p: значение p, которое соответствует статистике F-теста 0,43718 с числителем df = 14 и знаменателем df = 14. Значение p оказывается равным 0,1336 .
95% доверительный интервал: 95% доверительный интервал для истинного соотношения дисперсий между двумя группами. Оказывается, это [.147, 1.302] . Поскольку 1 содержится в этом интервале, вполне вероятно, что истинное соотношение дисперсий равно 1, т.е. равные дисперсии.
выборочные оценки: они представляют собой соотношение дисперсий между каждой группой. Если мы воспользуемся функцией var() , мы увидим, что выборочная дисперсия первой группы равна 21,8381, а выборочная дисперсия второй группы — 49,95238. Таким образом, соотношение дисперсий составляет 21,8381/49,95238 = 0,4371783 .
Напомним нулевую и альтернативную гипотезы этого теста:
- H 0 : Отклонения генеральной совокупности равны
- H A : Отклонения генеральной совокупности не равны.
Поскольку значение p нашего теста (0,1336) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.
Это означает, что у нас нет достаточных доказательств, чтобы сделать вывод о том, что разница в высоте растений между двумя видами неодинаковая.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как выполнить одновыборочный T-тест в R
Как выполнить Т-тест Уэлча в R
Как выполнить t-тест парных выборок в R