Як виконати повторювані вимірювання anova в python
Дисперсійний аналіз із повторними вимірюваннями використовується для визначення того, чи існує статистично значуща різниця між середніми значеннями трьох або більше груп, у кожній з яких є ті самі суб’єкти.
У цьому посібнику пояснюється, як виконати односторонній дисперсійний аналіз повторних вимірювань у Python.
Приклад: ANOVA повторних вимірювань у Python
Дослідники хочуть знати, чи чотири різні препарати викликають різний час реакції. Щоб перевірити це, вони виміряли час реакції п’яти пацієнтів на чотири різні препарати.
Оскільки кожен пацієнт вимірюється на кожному з чотирьох препаратів, ми використовуватимемо дисперсійний аналіз повторних вимірювань, щоб визначити, чи відрізняється середній час реакції між препаратами.
Виконайте наведені нижче кроки, щоб виконати дисперсійний аналіз повторних вимірювань у Python.
Крок 1: Введіть дані.
Спочатку ми створимо pandas DataFrame для зберігання наших даних:
import numpy as np import pandas as pd #createdata df = pd.DataFrame({'patient': np.repeat([1, 2, 3, 4, 5], 4), 'drug': np.tile([1, 2, 3, 4], 5), 'response': [30, 28, 16, 34, 14, 18, 10, 22, 24, 20, 18, 30, 38, 34, 20, 44, 26, 28, 14, 30]}) #view first ten rows of data df.head[:10] patient drug response 0 1 1 30 1 1 2 28 2 1 3 16 3 1 4 34 4 2 1 14 5 2 2 18 6 2 3 10 7 2 4 22 8 3 1 24 9 3 2 20
Крок 2: Виконайте повторні вимірювання ANOVA.
Далі ми виконаємо дисперсійний аналіз повторних вимірювань за допомогою функції AnovaRM() із бібліотеки statsmodels :
from statsmodels.stats.anova import AnovaRM #perform the repeated measures ANOVA print(AnovaRM(data= df , depvar=' response ', subject=' patient ', within=[' drug ']).fit()) Anova ==================================== F Value Num DF Den DF Pr > F ---------------------------------- drug 24.7589 3.0000 12.0000 0.0000 ====================================
Крок 3: Інтерпретація результатів.
Дисперсійний аналіз повторних вимірювань використовує такі нульові та альтернативні гіпотези:
Нульова гіпотеза (H 0 ): µ 1 = µ 2 = µ 3 (усі середні сукупності рівні)
Альтернативна гіпотеза: (Ha): принаймні одне середнє значення сукупності відрізняється від решти
У цьому прикладі статистика F-тесту становить 24,7589 , а відповідне значення p — 0,0000 .
Оскільки це p-значення менше 0,05, ми відхиляємо нульову гіпотезу та робимо висновок, що існує статистично значуща різниця в середньому часі реакції між чотирма препаратами.
Крок 4: Повідомте про результати.
Нарешті, ми повідомимо про результати наших повторних вимірювань ANOVA. Ось приклад того, як це зробити:
Односторонній повторний аналіз ANOVA був проведений на 5 осіб, щоб дослідити вплив чотирьох різних ліків на час відповіді.
Результати показали, що тип використовуваного препарату призводив до статистично значущих відмінностей у часі відповіді (F(3, 12) = 24,75887, p <0,001).
Додаткові ресурси
У наступних посібниках надається додаткова інформація про дисперсійний аналіз повторних вимірювань:
Односторонній дисперсійний аналіз і дисперсійний аналіз повторних вимірювань: різниця
Як вручну виконати повторний аналіз ANOVA
Три припущення повторних вимірювань ANOVA