Як виконати тест крускала-уолліса в r


Критерій Крускала-Уолліса використовується для визначення того, чи існує статистично значуща різниця між медіанами трьох або більше незалежних груп.

Це вважається непараметричним еквівалентом одностороннього дисперсійного аналізу .

Цей підручник пояснює, як виконати тест Крускала-Уолліса в R.

Приклад: тест Крускала-Уолліса в R

Припустімо, дослідники хочуть знати, чи призводять три різні добрива до різних рівнів росту рослин. Вони випадковим чином вибирають 30 різних рослин і ділять їх на три групи по 10 рослин, вносячи в кожну групу різні добрива. Через місяць вимірюють висоту кожної рослини.

Виконайте наступні кроки, щоб виконати тест Крускала-Уолліса, щоб визначити, чи однакове середнє зростання в усіх трьох групах.

Крок 1: Введіть дані.

Спочатку ми створимо такий кадр даних, який містить ріст 30 рослин, а також їхню групу добрив:

 #create data frame
df <- data. frame (group=rep(c(' A ', ' B ', ' C '), each= 10 ),
                 height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8,
                          15, 17, 13, 15, 15, 13, 9, 12, 10, 8,
                          6, 8, 8, 9, 5, 14, 13, 8, 10, 9))

#view first six rows of data frame
head(df)

  group height
1 to 7
2 to 14
3 to 14
4 to 13
5 to 12
6 to 9

Крок 2: Виконайте тест Крускала-Уолліса.

Далі ми виконаємо тест Крускала-Уолліса за допомогою вбудованої функції kruskal.test() бази даних R:

 #perform Kruskal-Wallis Test 
kruskal. test (height ~ group, data = df) 

	Kruskal-Wallis rank sum test

data: height by group
Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311

Крок 3: Інтерпретація результатів.

Тест Крускала-Уолліса використовує такі нульові та альтернативні гіпотези:

Нульова гіпотеза (H 0 ): Медіана однакова в усіх групах.

Альтернативна гіпотеза: ( HA ): медіана не однакова в усіх групах.

У цьому випадку тестова статистика становить 6,2878 , а відповідне значення p — 0,0431 .

Оскільки це p-значення менше 0,05, ми можемо відхилити нульову гіпотезу про те, що середній ріст рослин є однаковим для всіх трьох добрив.

Це означає, що ми маємо достатньо доказів, щоб зробити висновок, що тип добрива, який використовується, викликає статистично значущі відмінності у рості рослин.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші поширені статистичні тести в R:

Як виконати t-тест парних зразків у R
Як виконати односторонній дисперсійний аналіз у R
Як виконати повторний аналіз ANOVA у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *