Как выполнить тест крускала-уоллиса в r
Тест Крускала-Уоллиса используется для определения наличия или отсутствия статистически значимой разницы между медианами трех или более независимых групп.
Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .
В этом руководстве объясняется, как выполнить тест Крускала-Уоллиса в R.
Пример: тест Крускала-Уоллиса в R
Предположим, исследователи хотят знать, приводят ли три разных удобрения к разным уровням роста растений. Они случайным образом выбирают 30 разных растений и делят их на три группы по 10, применяя к каждой группе разные удобрения. Через месяц измеряют высоту каждого растения.
Выполните следующие шаги, чтобы выполнить тест Крускала-Уоллиса и определить, одинаков ли медианный рост во всех трех группах.
Шаг 1: Введите данные.
Сначала мы создадим следующий фрейм данных, который будет содержать данные о росте 30 растений, а также их группы удобрений:
#create data frame df <- data. frame (group=rep(c(' A ', ' B ', ' C '), each= 10 ), height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8, 15, 17, 13, 15, 15, 13, 9, 12, 10, 8, 6, 8, 8, 9, 5, 14, 13, 8, 10, 9)) #view first six rows of data frame head(df) group height 1 to 7 2 to 14 3 to 14 4 to 13 5 to 12 6 to 9
Шаг 2: Выполните тест Краскела-Уоллиса.
Далее мы выполним тест Крускала-Уоллиса, используя встроенную функцию kruskal.test() базы данных R:
#perform Kruskal-Wallis Test kruskal. test (height ~ group, data = df) Kruskal-Wallis rank sum test data: height by group Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311
Шаг 3: Интерпретируйте результаты.
Тест Краскела-Уоллиса использует следующие нулевые и альтернативные гипотезы:
Нулевая гипотеза (H 0 ): Медиана одинакова во всех группах.
Альтернативная гипотеза: ( HA ): Медиана не одинакова во всех группах.
В этом случае статистика теста равна 6,2878 , а соответствующее значение p — 0,0431 .
Поскольку это значение p меньше 0,05, мы можем отвергнуть нулевую гипотезу о том, что средний рост растений одинаков для всех трех удобрений.
Это означает, что у нас есть достаточно доказательств, чтобы сделать вывод, что тип используемого удобрения вызывает статистически значимые различия в росте растений.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные статистические тесты в R:
Как выполнить t-тест парных выборок в R
Как выполнить односторонний дисперсионный анализ в R
Как выполнить повторные измерения ANOVA в R