Как анализировать остатки в модели anova
ANOVA («дисперсионный анализ») — это тип модели, используемый для определения того, существует ли значительная разница между средними значениями трех или более независимых групп.
мы подгоняем дисперсионный анализ Всякий раз, когда модель соответствует набору данных, всегда будут остатки — они представляют собой разницу между каждым отдельным наблюдением и средним значением группы, из которого получено наблюдение.
В следующем примере показано, как на практике рассчитать остатки для модели ANOVA.
Пример: расчет остатков в ANOVA
Предположим, мы набираем 90 человек для участия в эксперименте по снижению веса, в котором случайным образом назначаем 30 человек следовать программе А, программе Б или программе С в течение месяца.
Мы можем выполнить однофакторный дисперсионный анализ, чтобы определить, существует ли статистически значимая разница между потерей веса в результате трех программ.
Предположим, мы рассчитаем среднюю потерю веса лиц, участвующих в каждой программе, следующим образом:
- Программа А : 1,58 фунта.
- Программа Б : 2,56 фунта.
- Программа C : 4,13 фунта.
Остаточные значения модели ANOVA будут представлять собой разницу между потерей веса каждого человека и средней потерей веса по его программе.
Например, в следующей таблице показано, как рассчитать остатки для 10 разных участников исследования:
Обратите внимание на следующую закономерность:
- Лица, у которых значение было выше среднего по группе, имели положительный остаток .
- Лица, у которых значение было ниже среднего по группе, имели отрицательный остаток .
На практике мы рассчитаем остатки для всех 90 человек.
Как использовать остатки для проверки нормальности
Одним из допущений ANOVA является то, что остатки имеют нормальное распределение.
Самый распространенный способ проверить это предположение — построить график QQ .
Если остатки распределены нормально, то точки на графике QQ будут лежать на прямой диагональной линии.
Вот как будет выглядеть график QQ для нашего предыдущего примера:
Кончики немного отклоняются от прямой диагональной линии на концах хвоста, но в целом кончики довольно хорошо падают по диагональной линии. Это говорит нам о том, что предположение о нормальности, вероятно, выполняется.
Для справки, вот как может выглядеть график QQ для ненормально распределенных остатков:
Точки сильно отклоняются от прямой диагональной линии, что указывает на неправильное распределение остатков.
Обратитесь к следующим руководствам, чтобы узнать, как создавать графики QQ в различных программах:
Дополнительные ресурсы
В следующих статьях представлена дополнительная информация о моделях ANOVA:
Введение в однофакторный дисперсионный анализ
Как проверить предположения ANOVA
4 примера использования ANOVA в реальной жизни