Как выполнить тест крускала-уоллиса на python
Тест Крускала-Уоллиса используется для определения наличия или отсутствия статистически значимой разницы между медианами трех или более независимых групп.
Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .
В этом руководстве объясняется, как выполнить тест Крускала-Уоллиса в Python.
Пример: тест Крускала-Уоллиса в Python
Исследователи хотят знать, приводят ли три разных удобрения к разным уровням роста растений. Они случайным образом выбирают 30 разных растений и делят их на три группы по 10, применяя к каждой группе разные удобрения. Через месяц измеряют высоту каждого растения.
Выполните следующие шаги, чтобы выполнить тест Крускала-Уоллиса и определить, одинаков ли медианный рост во всех трех группах.
Шаг 1: Введите данные.
Сначала мы создадим три таблицы для хранения измерений наших растений для каждой из трех групп:
group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8] group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8] group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]
Шаг 2: Выполните тест Краскела-Уоллиса.
Далее мы выполним тест Крускала-Уоллиса, используя функцию kruskal() из библиотеки scipy.stats:
from scipy import stats #perform Kruskal-Wallis Test stats.kruskal(group1, group2, group3) (statistic=6.2878, pvalue=0.0431)
Шаг 3: Интерпретируйте результаты.
Тест Краскела-Уоллиса использует следующие нулевые и альтернативные гипотезы:
Нулевая гипотеза (H 0 ): Медиана одинакова во всех группах.
Альтернативная гипотеза: (Ха): Медиана не одинакова во всех группах.
В этом случае статистика теста равна 6,2878 , а соответствующее значение p — 0,0431 . Поскольку это значение p меньше 0,05, мы можем отвергнуть нулевую гипотезу о том, что средний рост растений одинаков для всех трех удобрений. У нас есть достаточно доказательств, чтобы сделать вывод, что тип используемого удобрения вызывает статистически значимые различия в росте растений.