Критерий данна для множественных сравнений
Тест Крускала-Уоллиса используется для определения наличия или отсутствия статистически значимой разницы между медианами трех или более независимых групп. Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .
Если результаты теста Крускала-Уоллиса статистически значимы, то целесообразно выполнить тест Данна , чтобы точно определить, какие группы отличаются.
Критерий Данна выполняет попарные сравнения между каждой независимой группой и показывает, какие группы статистически значимо различаются на определенном уровне α.
Например, предположим, что исследователь хочет знать, оказывают ли три разных лекарства разное воздействие на боль в спине. Он набирает 30 субъектов для исследования и случайным образом назначает им препарат А, препарат Б или препарат С на месяц, а затем измеряет их боль в спине в конце месяца.
Исследователь может выполнить тест Крускала-Уоллиса, чтобы определить, одинакова ли средняя боль в спине между тремя препаратами. Если значение p теста Крускала-Уоллиса ниже определенного порога, можно сказать, что три препарата оказывают разное действие.
Затем исследователь мог бы провести тест Данна, чтобы определить, какие лекарства оказывают статистически значимый эффект.
Тест Данна: формула
Вероятно, вам никогда не придется выполнять тест Данна вручную, поскольку его можно выполнить с помощью статистического программного обеспечения (например, R, Python, Stata, SPSS и т. д.), но формула для расчета статистики z-теста для разницы между двумя группами: следующее:
z я знак равно y я / σ я
где i — одно из сравнений от 1 до m , y i = WA – W B (где WA — среднее значение суммы рангов для i- й группы), а σ i рассчитывается следующим образом:
σ i = √ ((N(N+1)/12) – (ΣT 3 s – T s /(12(N-1)) / ((1/n A )+(1/n B ))
где N — общее количество наблюдений во всех группах, r — количество связанных рангов, а T s — количество наблюдений, связанных с конкретным связанным значением.
Как контролировать уровень ошибок в семье
Всякий раз, когда мы выполняем несколько сравнений одновременно, важно контролировать частоту ошибок для каждого семейства . Один из способов сделать это — скорректировать значения p, полученные в результате множественных сравнений.
Существует несколько способов корректировки значений p, но наиболее распространенными являются два метода корректировки:
1. Корректировка Бонферрони
Скорректированное значение p = p*m
Золото:
- p: исходное значение p.
- m: общее количество сделанных сравнений
2. Корректировка Сидака
Скорректированное значение p = 1 – (1-p) м
Золото:
- p: исходное значение p.
- m: общее количество сделанных сравнений
Используя одну из этих корректировок значения p, мы можем значительно снизить вероятность совершения ошибки I рода среди набора множественных сравнений.
Дополнительные ресурсы
Как выполнить тест Данна в R
Как выполнить тест Данна на Python