Как выполнить тест тьюки в sas
Однофакторный дисперсионный анализ используется для определения наличия или отсутствия статистически значимой разницы между средними значениями трех или более независимых групп.
Если общее значение p таблицы ANOVA ниже определенного уровня значимости, то у нас есть достаточно доказательств, чтобы сказать, что по крайней мере одно из групповых средних значений отличается от других.
Однако это не говорит нам о том, какие группы отличаются друг от друга. Это просто говорит нам о том, что не все средние значения по группам одинаковы.
Чтобы точно узнать, какие группы отличаются друг от друга, нам нужно провести апостериорный тест .
Одним из наиболее часто используемых апостериорных тестов является тест Тьюки , который позволяет нам выполнять попарные сравнения между средними значениями каждой группы, контролируя при этом частоту семейных ошибок .
В следующем примере показано, как выполнить тест Тьюки в R.
Пример: тест Тьюки в SAS
Предположим, исследователь набирает 30 студентов для участия в исследовании. Студентам случайным образом назначаются использовать один из трех методов обучения для подготовки к экзамену.
Результаты экзамена для каждого студента показаны ниже:
Мы можем использовать следующий код для создания этого набора данных в SAS:
/*create dataset*/
data my_data;
input Method $Score;
datalines ;
At 78
At 81
At 82
At 82
At 85
At 88
At 88
At 90
B 81
B 83
B 83
B85
B 86
B 88
B90
B91
C 84
C 88
C 88
C 89
C 90
C 93
C 95
C 98
;
run ;
Далее мы будем использовать процедуру ANOVA для выполнения одностороннего дисперсионного анализа:
/*perform one-way ANOVA*/
proc ANOVA data =my_data;
classMethod ;
modelScore = Method;
means Method / tukey cldiff ;
run ;
Примечание . Мы использовали оператор средних значений вместе с параметрами tukey и cldiff , чтобы указать, что следует выполнить апостериорный тест Тьюки (с доверительными интервалами), если общее значение p из однофакторного дисперсионного анализа является статистически значимым. значительный.
Сначала мы проанализируем таблицу ANOVA в результате:
Из этой таблицы мы видим:
- Общее значение F: 5,26
- Соответствующее значение p: 0,0140.
Напомним, что однофакторный дисперсионный анализ использует следующие нулевые и альтернативные гипотезы:
- H 0 : Все средние значения группы равны.
- H A : По крайней мере одно среднее значение группы отличается отдых.
Поскольку значение p таблицы ANOVA (0,0140) меньше α = 0,05, мы отвергаем нулевую гипотезу.
Это говорит нам о том, что средний балл на экзамене не одинаков для всех трех методов обучения.
Связанный: Как интерпретировать F-значение и P-значение в ANOVA
Чтобы точно определить, какие групповые средние значения отличаются, нам нужно обратиться к окончательной таблице результатов, в которой показаны результаты апостериорных тестов Тьюки:
Чтобы выяснить, какие групповые средние значения различаются, нам нужно посмотреть, рядом с какими парными сравнениями стоят звездочки ( *** ).
Из таблицы мы видим, что существует статистически значимая разница в средних баллах экзамена между группой А и группой С.
Статистически значимых различий между средними значениями других групп нет.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация о моделях ANOVA:
Руководство по использованию апостериорного тестирования с помощью ANOVA
Как выполнить односторонний дисперсионный анализ в SAS
Как выполнить двусторонний дисперсионный анализ в SAS