Як виконати повторювані вимірювання anova в python


Дисперсійний аналіз із повторними вимірюваннями використовується для визначення того, чи існує статистично значуща різниця між середніми значеннями трьох або більше груп, у кожній з яких є ті самі суб’єкти.

У цьому посібнику пояснюється, як виконати односторонній дисперсійний аналіз повторних вимірювань у Python.

Приклад: ANOVA повторних вимірювань у Python

Дослідники хочуть знати, чи чотири різні препарати викликають різний час реакції. Щоб перевірити це, вони виміряли час реакції п’яти пацієнтів на чотири різні препарати.

Оскільки кожен пацієнт вимірюється на кожному з чотирьох препаратів, ми використовуватимемо дисперсійний аналіз повторних вимірювань, щоб визначити, чи відрізняється середній час реакції між препаратами.

Виконайте наведені нижче кроки, щоб виконати дисперсійний аналіз повторних вимірювань у Python.

Крок 1: Введіть дані.

Спочатку ми створимо pandas DataFrame для зберігання наших даних:

 import numpy as np
import pandas as pd

#createdata
df = pd.DataFrame({'patient': np.repeat([1, 2, 3, 4, 5], 4),
                   'drug': np.tile([1, 2, 3, 4], 5),
                   'response': [30, 28, 16, 34,
                                14, 18, 10, 22,
                                24, 20, 18, 30,
                                38, 34, 20, 44, 
                                26, 28, 14, 30]})

#view first ten rows of data 
df.head[:10]


	patient drug response
0 1 1 30
1 1 2 28
2 1 3 16
3 1 4 34
4 2 1 14
5 2 2 18
6 2 3 10
7 2 4 22
8 3 1 24
9 3 2 20

Крок 2: Виконайте повторні вимірювання ANOVA.

Далі ми виконаємо дисперсійний аналіз повторних вимірювань за допомогою функції AnovaRM() із бібліотеки statsmodels :

 from statsmodels.stats.anova import AnovaRM

#perform the repeated measures ANOVA
print(AnovaRM(data= df , depvar=' response ', subject=' patient ', within=[' drug ']).fit())

              Anova
====================================
     F Value Num DF Den DF Pr > F
----------------------------------
drug 24.7589 3.0000 12.0000 0.0000
====================================

Крок 3: Інтерпретація результатів.

Дисперсійний аналіз повторних вимірювань використовує такі нульові та альтернативні гіпотези:

Нульова гіпотеза (H 0 ): µ 1 = µ 2 = µ 3 (усі середні сукупності рівні)

Альтернативна гіпотеза: (Ha): принаймні одне середнє значення сукупності відрізняється від решти

У цьому прикладі статистика F-тесту становить 24,7589 , а відповідне значення p — 0,0000 .

Оскільки це p-значення менше 0,05, ми відхиляємо нульову гіпотезу та робимо висновок, що існує статистично значуща різниця в середньому часі реакції між чотирма препаратами.

Крок 4: Повідомте про результати.

Нарешті, ми повідомимо про результати наших повторних вимірювань ANOVA. Ось приклад того, як це зробити:

Односторонній повторний аналіз ANOVA був проведений на 5 осіб, щоб дослідити вплив чотирьох різних ліків на час відповіді.

Результати показали, що тип використовуваного препарату призводив до статистично значущих відмінностей у часі відповіді (F(3, 12) = 24,75887, p <0,001).

Додаткові ресурси

У наступних посібниках надається додаткова інформація про дисперсійний аналіз повторних вимірювань:

Односторонній дисперсійний аналіз і дисперсійний аналіз повторних вимірювань: різниця
Як вручну виконати повторний аналіз ANOVA
Три припущення повторних вимірювань ANOVA

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *