Как выполнить тест на коэффициент дисперсии в r (с примером)


Тест отношения дисперсии используется для проверки того, равны ли две дисперсии генеральной совокупности.

В этом тесте используются следующие нулевые и альтернативные гипотезы:

  • H 0 : Отклонения генеральной совокупности равны
  • H A : Отклонения генеральной совокупности не равны.

Для выполнения этого теста мы вычисляем следующую статистику теста:

F = с 1 2 / с 2 2

Золото:

  • s 1 2 : Выборочная дисперсия первой группы.
  • s 2 2 : Выборочная дисперсия второй группы.

Если значение p , соответствующее этой статистике F-теста, ниже определенного порога (например, 0,05), то мы отвергаем нулевую гипотезу и делаем вывод, что дисперсии генеральной совокупности не равны.

Чтобы выполнить тест коэффициента дисперсии в R, мы можем использовать встроенную функцию var.test() .

В следующем примере показано, как использовать эту функцию на практике.

Пример: проверка коэффициента дисперсии в R

Предположим, мы хотим знать, имеют ли два разных вида растений одинаковые различия в высоте.

Чтобы проверить это, мы собираем простую случайную выборку из 15 растений каждого вида.

Следующий код показывает, как выполнить тест коэффициента дисперсии в R, чтобы определить, одинакова ли разница по высоте между двумя видами:

 #create vectors to hold plant heights from each sample
group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19)
group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29)

#perform variance ratio test
var. test (group1, group2)

	F test to compare two variances

data: group1 and group2
F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.1467737 1.3021737
sample estimates:
ratio of variances 
         0.4371783

Вот как интерпретировать результаты теста:

данные: имена векторов, содержащих образцы данных.

F: Статистика F-теста. В данном случае это 0,43718 .

num df, denom df : степени свободы в числителе и знаменателе для статистики F-теста, рассчитываемые как n 1 – 1 и n 2 -1 соответственно.

Значение p: значение p, которое соответствует статистике F-теста 0,43718 с числителем df = 14 и знаменателем df = 14. Значение p оказывается равным 0,1336 .

95% доверительный интервал: 95% доверительный интервал для истинного соотношения дисперсий между двумя группами. Оказывается, это [.147, 1.302] . Поскольку 1 содержится в этом интервале, вполне вероятно, что истинное соотношение дисперсий равно 1, т.е. равные дисперсии.

выборочные оценки: они представляют собой соотношение дисперсий между каждой группой. Если мы воспользуемся функцией var() , мы увидим, что выборочная дисперсия первой группы равна 21,8381, а выборочная дисперсия второй группы — 49,95238. Таким образом, соотношение дисперсий составляет 21,8381/49,95238 = 0,4371783 .

Напомним нулевую и альтернативную гипотезы этого теста:

  • H 0 : Отклонения генеральной совокупности равны
  • H A : Отклонения генеральной совокупности не равны.

Поскольку значение p нашего теста (0,1336) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что у нас нет достаточных доказательств, чтобы сделать вывод о том, что разница в высоте растений между двумя видами неодинаковая.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как выполнить одновыборочный T-тест в R
Как выполнить Т-тест Уэлча в R
Как выполнить t-тест парных выборок в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *