Как выполнить повторные измерения anova в python
ANOVA с повторными измерениями используется для определения того, существует ли статистически значимая разница между средними значениями трех или более групп, в которых одни и те же субъекты появляются в каждой группе.
В этом руководстве объясняется, как выполнить односторонний дисперсионный анализ с повторными измерениями в Python.
Пример. ANOVA с повторяющимися измерениями в Python
Исследователи хотят знать, вызывают ли четыре разных препарата разное время реакции. Чтобы проверить это, они измерили время реакции пяти пациентов на четыре разных препарата.
Поскольку у каждого пациента измеряется прием каждого из четырех лекарств, мы будем использовать дисперсионный анализ с повторными измерениями, чтобы определить, различается ли среднее время реакции между лекарствами.
Используйте следующие шаги для выполнения повторных измерений ANOVA в Python.
Шаг 1: Введите данные.
Сначала мы создадим DataFrame pandas для хранения наших данных:
import numpy as np import pandas as pd #createdata df = pd.DataFrame({'patient': np.repeat([1, 2, 3, 4, 5], 4), 'drug': np.tile([1, 2, 3, 4], 5), 'response': [30, 28, 16, 34, 14, 18, 10, 22, 24, 20, 18, 30, 38, 34, 20, 44, 26, 28, 14, 30]}) #view first ten rows of data df.head[:10] patient drug response 0 1 1 30 1 1 2 28 2 1 3 16 3 1 4 34 4 2 1 14 5 2 2 18 6 2 3 10 7 2 4 22 8 3 1 24 9 3 2 20
Шаг 2: Выполните повторные измерения ANOVA.
Далее мы выполним повторные измерения ANOVA, используя функцию AnovaRM() из библиотеки statsmodels :
from statsmodels.stats.anova import AnovaRM #perform the repeated measures ANOVA print(AnovaRM(data= df , depvar=' response ', subject=' patient ', within=[' drug ']).fit()) Anova ==================================== F Value Num DF Den DF Pr > F ---------------------------------- drug 24.7589 3.0000 12.0000 0.0000 ====================================
Шаг 3: Интерпретируйте результаты.
ANOVA с повторными измерениями использует следующие нулевые и альтернативные гипотезы:
Нулевая гипотеза (H 0 ): µ 1 = µ 2 = µ 3 (все средние значения совокупности равны)
Альтернативная гипотеза: (Ха): по крайней мере одно среднее значение генеральной совокупности отличается от остальных.
В этом примере статистика F-теста равна 24,7589 , а соответствующее значение p — 0,0000 .
Поскольку это значение p меньше 0,05, мы отвергаем нулевую гипотезу и заключаем, что существует статистически значимая разница в среднем времени ответа между четырьмя препаратами.
Шаг 4: Сообщите о результатах.
Наконец, мы сообщим о результатах наших повторных измерений ANOVA. Вот пример того, как это сделать:
Однофакторный дисперсионный анализ с повторными измерениями был проведен у 5 человек, чтобы изучить влияние четырех различных лекарств на время ответа.
Результаты показали, что тип используемого лекарства приводил к статистически значимым различиям во времени ответа (F(3, 12) = 24,75887, p <0,001).
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о ANOVA с повторными измерениями:
Однофакторный дисперсионный анализ и дисперсионный анализ с повторными измерениями: разница
Как вручную выполнить повторные измерения ANOVA
Три предположения о повторных измерениях ANOVA