Як виконати тест данна в python


Критерій Крускала-Уолліса використовується для визначення того, чи існує статистично значуща різниця між медіанами трьох або більше незалежних груп. Це вважається непараметричним еквівалентом одностороннього дисперсійного аналізу .

Якщо результати тесту Крускала-Уолліса є статистично значущими, тоді доцільно виконати тест Данна , щоб точно визначити, які групи відрізняються.

Цей підручник пояснює, як виконати тест Данна в Python.

Приклад: тест Данна в Python

Дослідники хочуть знати, чи призводять три різні добрива до різного рівня росту рослин. Вони випадковим чином вибирають 30 різних рослин і ділять їх на три групи по 10 рослин, вносячи в кожну групу різні добрива. Через місяць вимірюють висоту кожної рослини.

Провівши тест Краскела-Уолліса, вони виявили, що загальне значення p є статистично значущим, що означає, що середній ріст у трьох групах неоднаковий. Потім вони виконують тест Данна, щоб точно визначити, які групи відрізняються.

Щоб виконати тест Данна в Python, ми можемо використати функцію posthoc_dunn() із бібліотеки scikit-posthocs.

Наступний код показує, як використовувати цю функцію:

Крок 1: Встановіть scikit-posthocs.

Спочатку нам потрібно встановити бібліотеку scikit-posthocs:

 pip install scikit-posthocs

Крок 2: Виконайте тест Данна.

Потім ми можемо створити дані та виконати тест Данна:

 #specify the growth of the 10 plants in each group
group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8]
group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8]
group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]
data = [group1, group2, group3]

#perform Dunn's test using a Bonferonni correction for the p-values
import scikit_posthocs as sp
sp. posthoc_dunn (data, p_adjust = ' bonferroni ')

               1 2 3
1 1.000000 0.550846 0.718451
2 0.550846 1.000000 0.036633
3 0.718451 0.036633 1.000000

Зауважте, що ми вирішили використовувати поправку Бонферроні для p-значень, щоб контролювати частоту помилок у сімейному плані , але інші потенційні варіанти для аргументу p_adjust включають:

  • сідак
  • Холм-Сідак
  • Саймс Хохберг
  • чоловік
  • fdr_bh
  • fdr_by
  • fdr_tsbh

Зверніться до документації , щоб дізнатися більше про кожен із цих методів коригування значення p.

Крок 3: Інтерпретація результатів.

За результатами тесту Данна можна спостерігати наступне:

  • Скоригований p-значення різниці між групою 1 і групою 2 становить 0,550846 .
  • Скориговане значення p для різниці між групою 1 і групою 3 становить 0,718451 .
  • Скориговане значення p для різниці між групою 2 і групою 3 становить 0,036633 .

Таким чином, єдині дві групи, які статистично значимо відрізняються при α = 0,05, це групи 2 і 3.

Додаткові ресурси

Вступ до тесту Данна для множинних порівнянь
Як виконати тест Данна в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *