Полное руководство: как интерпретировать результаты anova в sas
Однофакторный дисперсионный анализ используется для определения наличия или отсутствия статистически значимой разницы между средними значениями трех или более независимых групп.
В следующем примере показано, как интерпретировать результаты однофакторного дисперсионного анализа в SAS.
Пример: Интерпретация результатов ANOVA в SAS
Предположим, исследователь набирает 30 студентов для участия в исследовании. Студентам случайным образом назначаются использовать один из трех методов обучения для подготовки к экзамену.
Результаты экзамена для каждого студента показаны ниже:
Мы можем использовать следующий код для создания этого набора данных в SAS:
/*create dataset*/
data my_data;
input Method $Score;
datalines ;
At 78
At 81
At 82
At 82
At 85
At 88
At 88
At 90
B 81
B 83
B 83
B85
B 86
B 88
B90
B91
C 84
C 88
C 88
C 89
C 90
C 93
C 95
C 98
;
run ;
Далее мы будем использовать процедуру ANOVA для выполнения одностороннего дисперсионного анализа:
/*perform one-way ANOVA*/
proc ANOVA data =my_data;
classMethod ;
modelScore = Method;
means Method / tukey cldiff ;
run ;
Примечание . Мы использовали оператор средних значений вместе с параметрами tukey и cldiff , чтобы указать, что следует выполнить апостериорный тест Тьюки (с доверительными интервалами), если общее значение p из однофакторного дисперсионного анализа является статистически значимым.
Сначала мы посмотрим на таблицу ANOVA в результате:
Вот как интерпретировать каждое значение в выводе:
Модель DF: Степени свободы для метода переменных. Это рассчитывается как #groups -1. В данном случае было 3 разных метода исследования, поэтому это значение равно: 3-1 = 2 .
Ошибка DF: степени свободы остатков. Это рассчитывается как #общее количество наблюдений – #группы. В данном случае было 24 наблюдения и 3 группы, поэтому это значение равно: 24-3 = 21 .
Исправленная сумма : сумма модели DF и ошибки DF. Это значение равно 2 + 21 = 23 .
Модель суммы квадратов: сумма квадратов, связанная с методом переменной. Это значение составляет 175,583 .
Ошибка суммы квадратов: сумма квадратов, связанных с остатками или «ошибками». Это значение составляет 350,25 .
Итого исправленной суммы квадратов : сумма модели SS и ошибки SS. Это значение равно 525,833 .
Модель средних квадратов: средняя сумма квадратов, связанных с методом . Это рассчитывается как модель SS/модель DF или 175,583/2 = 87,79 .
Среднеквадратическая ошибка: средняя сумма квадратов, связанных с остатками. Это рассчитывается как ошибка SS / ошибка DF, что составляет 350,25/21 = 16,68 .
Значение F: общая статистика F модели ANOVA. Это рассчитывается как среднеквадратическая/среднеквадратическая ошибка модели или 87,79/16,68 = 5,26 .
Pr >F: значение p, связанное со статистикой F с числителем df = 2 и знаменателем df = 21. В этом случае значение p равно 0,0140 .
Самым важным значением в наборе результатов является значение p, поскольку оно говорит нам, существует ли значительная разница в средних значениях между тремя группами.
Напомним, что однофакторный дисперсионный анализ использует следующие нулевые и альтернативные гипотезы:
- H 0 (нулевая гипотеза): все средние значения группы равны.
- H A (альтернативная гипотеза): По крайней мере одно среднее значение группы отличается от других.
Поскольку значение p в нашей таблице ANOVA (0,0140) меньше 0,05, мы отвергаем нулевую гипотезу.
Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средний балл на экзамене не одинаков для всех трех методов обучения.
Чтобы точно определить, какие групповые средние значения отличаются, нам нужно обратиться к окончательной таблице результатов, в которой показаны результаты апостериорных тестов Тьюки:
Чтобы выяснить, какие групповые средние значения различаются, нам нужно посмотреть, рядом с какими парными сравнениями стоят звездочки ( *** ).
Из таблицы видно, что существует статистически значимая разница в средних баллах экзамена между группой А и группой С.
В частности, средняя разница в экзаменационных баллах между группой C и группой A составляет 6,375 .
95% доверительный интервал для средней разницы составляет [1,228, 11,522] .
Статистически значимых различий между средними значениями других групп нет.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о моделях ANOVA:
Руководство по использованию апостериорного тестирования с помощью ANOVA
Как выполнить односторонний дисперсионный анализ в SAS
Как выполнить двусторонний дисперсионный анализ в SAS