Полное руководство: как интерпретировать результаты anova в sas


Однофакторный дисперсионный анализ используется для определения наличия или отсутствия статистически значимой разницы между средними значениями трех или более независимых групп.

В следующем примере показано, как интерпретировать результаты однофакторного дисперсионного анализа в SAS.

Пример: Интерпретация результатов ANOVA в SAS

Предположим, исследователь набирает 30 студентов для участия в исследовании. Студентам случайным образом назначаются использовать один из трех методов обучения для подготовки к экзамену.

Результаты экзамена для каждого студента показаны ниже:

Мы можем использовать следующий код для создания этого набора данных в SAS:

 /*create dataset*/
data my_data;
    input Method $Score;
    datalines ;
At 78
At 81
At 82
At 82
At 85
At 88
At 88
At 90
B 81
B 83
B 83
B85
B 86
B 88
B90
B91
C 84
C 88
C 88
C 89
C 90
C 93
C 95
C 98
;
run ;

Далее мы будем использовать процедуру ANOVA для выполнения одностороннего дисперсионного анализа:

 /*perform one-way ANOVA*/
proc ANOVA data =my_data;
    classMethod ;
    modelScore = Method;
    means Method / tukey cldiff ;
run ;

Примечание . Мы использовали оператор средних значений вместе с параметрами tukey и cldiff , чтобы указать, что следует выполнить апостериорный тест Тьюки (с доверительными интервалами), если общее значение p из однофакторного дисперсионного анализа является статистически значимым.

Сначала мы посмотрим на таблицу ANOVA в результате:

Односторонний дисперсионный анализ в SAS

Вот как интерпретировать каждое значение в выводе:

Модель DF: Степени свободы для метода переменных. Это рассчитывается как #groups -1. В данном случае было 3 разных метода исследования, поэтому это значение равно: 3-1 = 2 .

Ошибка DF: степени свободы остатков. Это рассчитывается как #общее количество наблюдений – #группы. В данном случае было 24 наблюдения и 3 группы, поэтому это значение равно: 24-3 = 21 .

Исправленная сумма : сумма модели DF и ошибки DF. Это значение равно 2 + 21 = 23 .

Модель суммы квадратов: сумма квадратов, связанная с методом переменной. Это значение составляет 175,583 .

Ошибка суммы квадратов: сумма квадратов, связанных с остатками или «ошибками». Это значение составляет 350,25 .

Итого исправленной суммы квадратов : сумма модели SS и ошибки SS. Это значение равно 525,833 .

Модель средних квадратов: средняя сумма квадратов, связанных с методом . Это рассчитывается как модель SS/модель DF или 175,583/2 = 87,79 .

Среднеквадратическая ошибка: средняя сумма квадратов, связанных с остатками. Это рассчитывается как ошибка SS / ошибка DF, что составляет 350,25/21 = 16,68 .

Значение F: общая статистика F модели ANOVA. Это рассчитывается как среднеквадратическая/среднеквадратическая ошибка модели или 87,79/16,68 = 5,26 .

Pr >F: значение p, связанное со статистикой F с числителем df = 2 и знаменателем df = 21. В этом случае значение p равно 0,0140 .

Самым важным значением в наборе результатов является значение p, поскольку оно говорит нам, существует ли значительная разница в средних значениях между тремя группами.

Напомним, что однофакторный дисперсионный анализ использует следующие нулевые и альтернативные гипотезы:

  • H 0 (нулевая гипотеза): все средние значения группы равны.
  • H A (альтернативная гипотеза): По крайней мере одно среднее значение группы отличается от других.

Поскольку значение p в нашей таблице ANOVA (0,0140) меньше 0,05, мы отвергаем нулевую гипотезу.

Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средний балл на экзамене не одинаков для всех трех методов обучения.

Чтобы точно определить, какие групповые средние значения отличаются, нам нужно обратиться к окончательной таблице результатов, в которой показаны результаты апостериорных тестов Тьюки:

Тест Тьюки в SAS

Чтобы выяснить, какие групповые средние значения различаются, нам нужно посмотреть, рядом с какими парными сравнениями стоят звездочки ( *** ).

Из таблицы видно, что существует статистически значимая разница в средних баллах экзамена между группой А и группой С.

В частности, средняя разница в экзаменационных баллах между группой C и группой A составляет 6,375 .

95% доверительный интервал для средней разницы составляет [1,228, 11,522] .

Статистически значимых различий между средними значениями других групп нет.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о моделях ANOVA:

Руководство по использованию апостериорного тестирования с помощью ANOVA
Как выполнить односторонний дисперсионный анализ в SAS
Как выполнить двусторонний дисперсионный анализ в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *