Как выполнить тест шеффе в r
Однофакторный дисперсионный анализ используется для определения наличия или отсутствия статистически значимой разницы между средними значениями трех или более независимых групп.
Если общее значение p таблицы ANOVA ниже определенного уровня значимости, то у нас есть достаточно доказательств, чтобы сказать, что по крайней мере одно из групповых средних значений отличается от других.
Однако это не говорит нам о том, какие группы отличаются друг от друга. Это просто говорит нам о том, что не все средние значения по группам одинаковы.
Чтобы точно знать, какие группы отличаются друг от друга, нам нужно провести апостериорный тест , который сможет контролировать частоту ошибок на семейство .
Одним из наиболее часто используемых апостериорных тестов является тест Шеффе.
В этом руководстве объясняется, как выполнить тест Шеффе в R.
Пример: тест Шеффе в R
Предположим, учитель хочет знать, приводят ли три разных метода обучения к разным результатам тестов среди учащихся. Чтобы проверить это, она случайным образом назначает 10 студентов использовать каждый метод обучения и записывает результаты их экзаменов.
Мы можем использовать следующие шаги в R, чтобы подобрать однофакторный дисперсионный анализ для проверки различий в средних баллах на экзамене между тремя группами, и использовать тест Шеффе, чтобы точно определить, какие группы различаются.
Шаг 1: Создайте набор данных.
Следующий код показывает, как создать набор данных, содержащий результаты экзаменов всех 30 студентов:
#create data frame data <- data.frame(technique = rep (c("tech1", "tech2", "tech3"), each = 10 ), score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89, 81, 82, 83, 83, 83, 84, 87, 90, 92, 93, 77, 78, 79, 88, 89, 90, 91, 95, 95, 98)) #view first six rows of data frame head(data) technical score 1 tech1 76 2 tech1 77 3 tech1 77 4 tech1 81 5 tech1 82 6 tech1 82
Шаг 2. Просмотрите результаты экзамена для каждой группы.
Следующий код показывает, как создать коробчатые диаграммы для визуализации распределения результатов экзамена для каждой группы:
boxplot(score ~ technique, data = data, main = "Exam Scores by Studying Technique", xlab = "Studying Technique", ylab = "Exam Scores", col = "steelblue", border = "black")
Шаг 3: Выполните односторонний дисперсионный анализ.
Следующий код показывает, как выполнить однофакторный дисперсионный анализ для проверки различий между средними баллами экзамена в каждой группе:
#fit the one-way ANOVA model model <- aov(score ~ technique, data = data) #view model output summary(model) Df Sum Sq Mean Sq F value Pr(>F) technical 2 211.5 105.73 3.415 0.0476 * Residuals 27 836.0 30.96 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Поскольку общее значение p ( 0,0476 ) меньше 0,05, это указывает на то, что каждая группа не имеет одинаковый средний балл на экзамене.
Далее мы проведем тест Шеффе, чтобы определить, какие группы отличаются.
Шаг 4: Выполните тест Шеффе.
Для выполнения теста Scheffe мы будем использовать функцию ScheffeTest() из пакета DescTools .
Следующий код показывает, как использовать эту функцию для нашего примера:
#load DescTools package library(DescTools) #perform Scheffe's test ScheffeTest(model) Posthoc multiple comparisons of means: Scheffe Test 95% family-wise confidence level $technical diff lwr.ci upr.ci pval tech2-tech1 4.2 -2.24527202 10.645272 0.2582 tech3-tech1 6.4 -0.04527202 12.845272 0.0519 . tech3-tech2 2.2 -4.24527202 8.645272 0.6803 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Интерпретация результата следующая:
- Средняя разница в результатах экзамена между методикой 2 и методикой 1 составляет 4,2 . Соответствующее значение p для средней разницы составляет 0,2582 .
- Средняя разница в результатах экзамена между методикой 3 и методикой 1 составляет 6,4 . Соответствующее значение p для средней разницы составляет 0,0519 .
- Средняя разница в результатах экзамена между методикой 3 и методикой 2 составляет 2,2 . Соответствующее значение p для средней разницы составляет 0,6803 .
В зависимости от того, какой уровень значимости мы решим использовать, единственные две группы, которые статистически значимо различаются, — это Метод 3 и Метод 1.
Дополнительные ресурсы
Как выполнить односторонний дисперсионный анализ в R
Как выполнить тест Тьюки в R
Как выполнить коррекцию Бонферрони в R