Критерий данна для множественных сравнений


Тест Крускала-Уоллиса используется для определения наличия или отсутствия статистически значимой разницы между медианами трех или более независимых групп. Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .

Если результаты теста Крускала-Уоллиса статистически значимы, то целесообразно выполнить тест Данна , чтобы точно определить, какие группы отличаются.

Критерий Данна выполняет попарные сравнения между каждой независимой группой и показывает, какие группы статистически значимо различаются на определенном уровне α.

Например, предположим, что исследователь хочет знать, оказывают ли три разных лекарства разное воздействие на боль в спине. Он набирает 30 субъектов для исследования и случайным образом назначает им препарат А, препарат Б или препарат С на месяц, а затем измеряет их боль в спине в конце месяца.

Исследователь может выполнить тест Крускала-Уоллиса, чтобы определить, одинакова ли средняя боль в спине между тремя препаратами. Если значение p теста Крускала-Уоллиса ниже определенного порога, можно сказать, что три препарата оказывают разное действие.

Затем исследователь мог бы провести тест Данна, чтобы определить, какие лекарства оказывают статистически значимый эффект.

Тест Данна: формула

Вероятно, вам никогда не придется выполнять тест Данна вручную, поскольку его можно выполнить с помощью статистического программного обеспечения (например, R, Python, Stata, SPSS и т. д.), но формула для расчета статистики z-теста для разницы между двумя группами: следующее:

z я знак равно y я / σ я

где i — одно из сравнений от 1 до m , y i = WA – W B (где WA — среднее значение суммы рангов для i- й группы), а σ i рассчитывается следующим образом:

σ i = √ ((N(N+1)/12) – (ΣT 3 s – T s /(12(N-1)) / ((1/n A )+(1/n B ))

где N — общее количество наблюдений во всех группах, r — количество связанных рангов, а T s — количество наблюдений, связанных с конкретным связанным значением.

Как контролировать уровень ошибок в семье

Всякий раз, когда мы выполняем несколько сравнений одновременно, важно контролировать частоту ошибок для каждого семейства . Один из способов сделать это — скорректировать значения p, полученные в результате множественных сравнений.

Существует несколько способов корректировки значений p, но наиболее распространенными являются два метода корректировки:

1. Корректировка Бонферрони

Скорректированное значение p = p*m

Золото:

  • p: исходное значение p.
  • m: общее количество сделанных сравнений

2. Корректировка Сидака

Скорректированное значение p = 1 – (1-p) м

Золото:

  • p: исходное значение p.
  • m: общее количество сделанных сравнений

Используя одну из этих корректировок значения p, мы можем значительно снизить вероятность совершения ошибки I рода среди набора множественных сравнений.

Дополнительные ресурсы

Как выполнить тест Данна в R
Как выполнить тест Данна на Python

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *