Тест данна для множинних порівнянь


Критерій Краскела-Уолліса використовується для визначення того, чи існує статистично значуща різниця між медіанами трьох або більше незалежних груп. Це вважається непараметричним еквівалентом одностороннього дисперсійного аналізу .

Якщо результати тесту Краскела-Уолліса є статистично значущими, тоді доцільно виконати тест Данна , щоб точно визначити, які групи відрізняються.

Тест Данна виконує попарні порівняння між кожною незалежною групою та повідомляє вам, які групи статистично суттєво відрізняються на певному рівні α.

Наприклад, припустімо, що дослідник хоче знати, чи три різні ліки по-різному впливають на біль у спині. Він набирає 30 суб’єктів для дослідження і випадковим чином призначає їм препарат А, препарат Б або препарат С протягом місяця, а потім вимірює їхній біль у спині в кінці місяця.

Дослідник може виконати тест Крускала-Уолліса, щоб визначити, чи однакова медіана болю в спині між трьома ліками. Якщо р-значення тесту Крускала-Уолліса нижче певного порогу, можна сказати, що три препарати мають різні ефекти.

Потім дослідник міг виконати тест Данна, щоб визначити, які препарати викликають статистично значущі ефекти.

Тест Данна: формула

Можливо, вам ніколи не доведеться виконувати тест Данна вручну, оскільки це можна зробити за допомогою статистичного програмного забезпечення (наприклад, R, Python, Stata, SPSS тощо), але формула для обчислення статистики z-тесту для різниці між двома групами така: наступним чином:

z i = y i / σ i

де i – одне з порівнянь від 1 до m , y i = W A – W B (де W A – середнє значення суми рангів для i- ї групи), а σ i обчислюється таким чином:

σ i = √ ((N(N+1)/12) – (ΣT 3 s – T s /(12(N-1)) / ((1/n A )+(1/n B ))

де N – загальна кількість спостережень у всіх групах, r – кількість зв’язаних рангів, а T s – кількість спостережень, пов’язаних із конкретним го зв’язаним значенням.

Як контролювати частоту помилок за сім’єю

Щоразу, коли ми виконуємо кілька порівнянь одночасно, важливо контролювати рівень помилок для кожної групи . Один із способів зробити це – скоригувати р-значення, отримані в результаті кількох порівнянь.

Існує кілька способів коригування p-значень, але два найпоширеніші методи коригування:

1. Коригування Бонферроні

Скоригований р-значення = p*m

золото:

  • p: вихідне значення p
  • m: загальна кількість проведених порівнянь

2. Регулювання Сідака

Скориговане p-значення = 1 – (1-p) m

золото:

  • p: вихідне значення p
  • m: загальна кількість проведених порівнянь

Використовуючи одне з цих коригувань значення p, ми можемо значно зменшити ймовірність створення помилки типу I серед набору кількох порівнянь.

Додаткові ресурси

Як виконати тест Данна в R
Як виконати тест Данна в Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *