Как выполнить тест данна на python


Тест Крускала -Уоллиса используется для определения наличия или отсутствия статистически значимой разницы между медианами трех или более независимых групп. Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .

Если результаты теста Крускала-Уоллиса статистически значимы, то целесообразно выполнить тест Данна , чтобы точно определить, какие группы отличаются.

В этом руководстве объясняется, как выполнить тест Данна в Python.

Пример: тест Данна в Python

Исследователи хотят знать, приводят ли три разных удобрения к разным уровням роста растений. Они случайным образом выбирают 30 разных растений и делят их на три группы по 10, применяя к каждой группе разные удобрения. Через месяц измеряют высоту каждого растения.

Проведя тест Крускала-Уоллиса, они обнаружили, что общее значение p статистически значимо, а это означает, что средний рост не одинаков в трех группах. Затем они выполняют тест Данна, чтобы точно определить, какие группы отличаются.

Чтобы выполнить тест Данна в Python, мы можем использовать функцию posthoc_dunn() из библиотеки scikit-posthocs.

Следующий код показывает, как использовать эту функцию:

Шаг 1. Установите scikit-posthocs.

Сначала нам нужно установить библиотеку scikit-posthocs:

 pip install scikit-posthocs

Шаг 2: Проведите тест Данна.

Затем мы можем создать данные и выполнить тест Данна:

 #specify the growth of the 10 plants in each group
group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8]
group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8]
group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]
data = [group1, group2, group3]

#perform Dunn's test using a Bonferonni correction for the p-values
import scikit_posthocs as sp
sp. posthoc_dunn (data, p_adjust = ' bonferroni ')

               1 2 3
1 1.000000 0.550846 0.718451
2 0.550846 1.000000 0.036633
3 0.718451 0.036633 1.000000

Обратите внимание, что мы решили использовать поправку Бонферрони для p-значений, чтобы контролировать частоту ошибок по всей семье , но другие потенциальные варианты аргумента p_adjust включают в себя:

  • Сидак
  • Холм-Сидак
  • Саймс Хохберг
  • мужчина
  • fdr_bh
  • fdr_by
  • fdr_tsbh

Обратитесь к документации для получения более подробной информации о каждом из этих методов корректировки значения p.

Шаг 3: Интерпретируйте результаты.

По результатам теста Данна мы можем наблюдать следующее:

  • Скорректированное значение p для разницы между группой 1 и группой 2 составляет 0,550846 .
  • Скорректированное значение p для разницы между группой 1 и группой 3 составляет 0,718451 .
  • Скорректированное значение p для разницы между группой 2 и группой 3 составляет 0,036633 .

Таким образом, единственными двумя группами, которые статистически значимо различаются при α = 0,05, являются группы 2 и 3.

Дополнительные ресурсы

Введение в тест Данна для множественных сравнений
Как выполнить тест Данна в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *