Як виконати тест данна в python
Критерій Крускала-Уолліса використовується для визначення того, чи існує статистично значуща різниця між медіанами трьох або більше незалежних груп. Це вважається непараметричним еквівалентом одностороннього дисперсійного аналізу .
Якщо результати тесту Крускала-Уолліса є статистично значущими, тоді доцільно виконати тест Данна , щоб точно визначити, які групи відрізняються.
Цей підручник пояснює, як виконати тест Данна в Python.
Приклад: тест Данна в Python
Дослідники хочуть знати, чи призводять три різні добрива до різного рівня росту рослин. Вони випадковим чином вибирають 30 різних рослин і ділять їх на три групи по 10 рослин, вносячи в кожну групу різні добрива. Через місяць вимірюють висоту кожної рослини.
Провівши тест Краскела-Уолліса, вони виявили, що загальне значення p є статистично значущим, що означає, що середній ріст у трьох групах неоднаковий. Потім вони виконують тест Данна, щоб точно визначити, які групи відрізняються.
Щоб виконати тест Данна в Python, ми можемо використати функцію posthoc_dunn() із бібліотеки scikit-posthocs.
Наступний код показує, як використовувати цю функцію:
Крок 1: Встановіть scikit-posthocs.
Спочатку нам потрібно встановити бібліотеку scikit-posthocs:
pip install scikit-posthocs
Крок 2: Виконайте тест Данна.
Потім ми можемо створити дані та виконати тест Данна:
#specify the growth of the 10 plants in each group group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8] group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8] group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9] data = [group1, group2, group3] #perform Dunn's test using a Bonferonni correction for the p-values import scikit_posthocs as sp sp. posthoc_dunn (data, p_adjust = ' bonferroni ') 1 2 3 1 1.000000 0.550846 0.718451 2 0.550846 1.000000 0.036633 3 0.718451 0.036633 1.000000
Зауважте, що ми вирішили використовувати поправку Бонферроні для p-значень, щоб контролювати частоту помилок у сімейному плані , але інші потенційні варіанти для аргументу p_adjust включають:
- сідак
- Холм-Сідак
- Саймс Хохберг
- чоловік
- fdr_bh
- fdr_by
- fdr_tsbh
Зверніться до документації , щоб дізнатися більше про кожен із цих методів коригування значення p.
Крок 3: Інтерпретація результатів.
За результатами тесту Данна можна спостерігати наступне:
- Скоригований p-значення різниці між групою 1 і групою 2 становить 0,550846 .
- Скориговане значення p для різниці між групою 1 і групою 3 становить 0,718451 .
- Скориговане значення p для різниці між групою 2 і групою 3 становить 0,036633 .
Таким чином, єдині дві групи, які статистично значимо відрізняються при α = 0,05, це групи 2 і 3.
Додаткові ресурси
Вступ до тесту Данна для множинних порівнянь
Як виконати тест Данна в R