Как выполнить тест крускала-уоллиса в r


Тест Крускала-Уоллиса используется для определения наличия или отсутствия статистически значимой разницы между медианами трех или более независимых групп.

Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .

В этом руководстве объясняется, как выполнить тест Крускала-Уоллиса в R.

Пример: тест Крускала-Уоллиса в R

Предположим, исследователи хотят знать, приводят ли три разных удобрения к разным уровням роста растений. Они случайным образом выбирают 30 разных растений и делят их на три группы по 10, применяя к каждой группе разные удобрения. Через месяц измеряют высоту каждого растения.

Выполните следующие шаги, чтобы выполнить тест Крускала-Уоллиса и определить, одинаков ли медианный рост во всех трех группах.

Шаг 1: Введите данные.

Сначала мы создадим следующий фрейм данных, который будет содержать данные о росте 30 растений, а также их группы удобрений:

 #create data frame
df <- data. frame (group=rep(c(' A ', ' B ', ' C '), each= 10 ),
                 height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8,
                          15, 17, 13, 15, 15, 13, 9, 12, 10, 8,
                          6, 8, 8, 9, 5, 14, 13, 8, 10, 9))

#view first six rows of data frame
head(df)

  group height
1 to 7
2 to 14
3 to 14
4 to 13
5 to 12
6 to 9

Шаг 2: Выполните тест Краскела-Уоллиса.

Далее мы выполним тест Крускала-Уоллиса, используя встроенную функцию kruskal.test() базы данных R:

 #perform Kruskal-Wallis Test 
kruskal. test (height ~ group, data = df) 

	Kruskal-Wallis rank sum test

data: height by group
Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311

Шаг 3: Интерпретируйте результаты.

Тест Краскела-Уоллиса использует следующие нулевые и альтернативные гипотезы:

Нулевая гипотеза (H 0 ): Медиана одинакова во всех группах.

Альтернативная гипотеза: ( HA ): Медиана не одинакова во всех группах.

В этом случае статистика теста равна 6,2878 , а соответствующее значение p — 0,0431 .

Поскольку это значение p меньше 0,05, мы можем отвергнуть нулевую гипотезу о том, что средний рост растений одинаков для всех трех удобрений.

Это означает, что у нас есть достаточно доказательств, чтобы сделать вывод, что тип используемого удобрения вызывает статистически значимые различия в росте растений.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные статистические тесты в R:

Как выполнить t-тест парных выборок в R
Как выполнить односторонний дисперсионный анализ в R
Как выполнить повторные измерения ANOVA в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *