Как выполнить тест шеффе в r


Однофакторный дисперсионный анализ используется для определения наличия или отсутствия статистически значимой разницы между средними значениями трех или более независимых групп.

Если общее значение p таблицы ANOVA ниже определенного уровня значимости, то у нас есть достаточно доказательств, чтобы сказать, что по крайней мере одно из групповых средних значений отличается от других.

Однако это не говорит нам о том, какие группы отличаются друг от друга. Это просто говорит нам о том, что не все средние значения по группам одинаковы.

Чтобы точно знать, какие группы отличаются друг от друга, нам нужно провести апостериорный тест , который сможет контролировать частоту ошибок на семейство .

Одним из наиболее часто используемых апостериорных тестов является тест Шеффе.

В этом руководстве объясняется, как выполнить тест Шеффе в R.

Пример: тест Шеффе в R

Предположим, учитель хочет знать, приводят ли три разных метода обучения к разным результатам тестов среди учащихся. Чтобы проверить это, она случайным образом назначает 10 студентов использовать каждый метод обучения и записывает результаты их экзаменов.

Мы можем использовать следующие шаги в R, чтобы подобрать однофакторный дисперсионный анализ для проверки различий в средних баллах на экзамене между тремя группами, и использовать тест Шеффе, чтобы точно определить, какие группы различаются.

Шаг 1: Создайте набор данных.

Следующий код показывает, как создать набор данных, содержащий результаты экзаменов всех 30 студентов:

 #create data frame
data <- data.frame(technique = rep (c("tech1", "tech2", "tech3"), each = 10 ),
                   score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89,
                             81, 82, 83, 83, 83, 84, 87, 90, 92, 93,
                             77, 78, 79, 88, 89, 90, 91, 95, 95, 98))

#view first six rows of data frame
head(data)

  technical score
1 tech1 76
2 tech1 77
3 tech1 77
4 tech1 81
5 tech1 82
6 tech1 82

Шаг 2. Просмотрите результаты экзамена для каждой группы.

Следующий код показывает, как создать коробчатые диаграммы для визуализации распределения результатов экзамена для каждой группы:

 boxplot(score ~ technique,
        data = data,
        main = "Exam Scores by Studying Technique",
        xlab = "Studying Technique",
        ylab = "Exam Scores",
        col = "steelblue",
        border = "black")

Поправка Бонферрони в R

Шаг 3: Выполните односторонний дисперсионный анализ.

Следующий код показывает, как выполнить однофакторный дисперсионный анализ для проверки различий между средними баллами экзамена в каждой группе:

 #fit the one-way ANOVA model
model <- aov(score ~ technique, data = data)

#view model output
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)  
technical 2 211.5 105.73 3.415 0.0476 *
Residuals 27 836.0 30.96                 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Поскольку общее значение p ( 0,0476 ) меньше 0,05, это указывает на то, что каждая группа не имеет одинаковый средний балл на экзамене.

Далее мы проведем тест Шеффе, чтобы определить, какие группы отличаются.

Шаг 4: Выполните тест Шеффе.

Для выполнения теста Scheffe мы будем использовать функцию ScheffeTest() из пакета DescTools .

Следующий код показывает, как использовать эту функцию для нашего примера:

 #load DescTools package
library(DescTools)

#perform Scheffe's test
ScheffeTest(model)

  Posthoc multiple comparisons of means: Scheffe Test 
    95% family-wise confidence level

$technical
            diff lwr.ci upr.ci pval    
tech2-tech1 4.2 -2.24527202 10.645272 0.2582    
tech3-tech1 6.4 -0.04527202 12.845272 0.0519 .  
tech3-tech2 2.2 -4.24527202 8.645272 0.6803    

---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Интерпретация результата следующая:

  • Средняя разница в результатах экзамена между методикой 2 и методикой 1 составляет 4,2 . Соответствующее значение p для средней разницы составляет 0,2582 .
  • Средняя разница в результатах экзамена между методикой 3 и методикой 1 составляет 6,4 . Соответствующее значение p для средней разницы составляет 0,0519 .
  • Средняя разница в результатах экзамена между методикой 3 и методикой 2 составляет 2,2 . Соответствующее значение p для средней разницы составляет 0,6803 .

В зависимости от того, какой уровень значимости мы решим использовать, единственные две группы, которые статистически значимо различаются, — это Метод 3 и Метод 1.

Дополнительные ресурсы

Как выполнить односторонний дисперсионный анализ в R
Как выполнить тест Тьюки в R
Как выполнить коррекцию Бонферрони в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *