Как выполнить апостериорные парные сравнения в r


Однофакторный дисперсионный анализ используется для определения наличия или отсутствия статистически значимой разницы между средними значениями трех или более независимых групп.

Односторонний дисперсионный анализ использует следующие нулевые и альтернативные гипотезы:

  • H 0 : Все средние значения группы равны.
  • ХА : Не все средние показатели по группам одинаковы.

Если общее значение p ANOVA ниже определенного уровня значимости (например, α = 0,05), то мы отвергаем нулевую гипотезу и заключаем, что все средние значения группы не равны.

Чтобы выяснить, какие групповые средние значения различаются, мы можем затем выполнить апостериорные парные сравнения .

В следующем примере показано, как выполнить следующие апостериорные парные сравнения в R:

  • Метод Тьюки
  • Метод Шеффе
  • Метод Бонферрони
  • Метод Холма

Пример: односторонний дисперсионный анализ в R

Предположим, учитель хочет знать, приводят ли три разных метода обучения к разным результатам тестов среди учащихся. Чтобы проверить это, она случайным образом назначает 10 студентов использовать каждый метод обучения и записывает результаты их экзаменов.

Мы можем использовать следующий код на R для выполнения однофакторного дисперсионного анализа для проверки различий в средних баллах на экзамене между тремя группами:

 #create data frame
df <- data.frame(technique = rep(c(" tech1 ", " tech2 ", " tech3 "), each= 10 ),
                 score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89,
                           81, 82, 83, 83, 83, 84, 87, 90, 92, 93,
                           77, 78, 79, 88, 89, 90, 91, 95, 95, 98))

#perform one-way ANOVA
model <- aov(score ~ technique, data = df)

#view output of ANOVA
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)  
technical 2 211.5 105.73 3.415 0.0476 *
Residuals 27 836.0 30.96                 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Общее значение p ANOVA (0,0476) меньше α = 0,05, поэтому мы отклоним нулевую гипотезу о том, что средний балл экзамена одинаков для каждого метода исследования.

Мы можем провести апостериорные попарные сравнения, чтобы определить, какие группы имеют разные средние значения.

Метод Тьюки

Лучше всего использовать апостериорный метод Тьюки, когда размер выборки каждой группы одинаков.

Мы можем использовать встроенную функцию TukeyHSD() для выполнения апостериорного метода Тьюки в R:

 #perform the Tukey post-hoc method
TukeyHSD(model, conf. level = .95 )

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = score ~ technique, data = df)

$technical
            diff lwr upr p adj
tech2-tech1 4.2 -1.9700112 10.370011 0.2281369
tech3-tech1 6.4 0.2299888 12.570011 0.0409017
tech3-tech2 2.2 -3.9700112 8.370011 0.6547756

Из результата мы видим, что единственное значение p (« p adj ») меньше 0,05 — это разница между методом и методом 3.

Таким образом, мы пришли к выводу, что существует только статистически значимая разница в средних баллах на экзамене между студентами, использовавшими Технику 1 и Технику 3.

Метод Шеффе

Метод Шеффе является наиболее консервативным методом апостериорного парного сравнения и дает самые широкие доверительные интервалы при сравнении групповых средних.

Мы можем использовать функцию ScheffeTest() из пакета DescTools для запуска апостериорного метода Scheffe в R:

 library (DescTools)

#perform the Scheffe post-hoc method
ScheffeTest(model)

  Posthoc multiple comparisons of means: Scheffe Test 
    95% family-wise confidence level

$technical
            diff lwr.ci upr.ci pval    
tech2-tech1 4.2 -2.24527202 10.645272 0.2582    
tech3-tech1 6.4 -0.04527202 12.845272 0.0519 .  
tech3-tech2 2.2 -4.24527202 8.645272 0.6803    

---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1'''156

Из результатов мы видим, что нет значений p ниже 0,05, поэтому мы можем сделать вывод, что нет статистически значимой разницы в средних баллах на экзамене между группами.

Метод Бонферрони

Лучше всего использовать метод Бонферрони, когда вы хотите выполнить набор запланированных парных сравнений.

Мы можем использовать следующий синтаксис в R для выполнения апостериорного метода Бонферрони:

 #perform the Bonferroni post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' bonferroni ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.309 -    
tech3 0.048 1.000

P value adjustment method: bonferroni

Из результата мы видим, что единственное значение p меньше 0,05 — это разница между методом и методом 3.

Таким образом, мы пришли к выводу, что существует только статистически значимая разница в средних баллах на экзамене между студентами, использовавшими Технику 1 и Технику 3.

Метод Холма

Метод Холма также используется, когда вы хотите заранее выполнить набор запланированных парных сравнений, и он, как правило, имеет даже большую мощность, чем метод Бонферрони, поэтому его часто предпочитают.

Мы можем использовать следующий синтаксис в R для запуска апостериорного метода Холма:

 #perform the Holm post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' holm ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.206 -    
tech3 0.048 0.384

P value adjustment method: holm

Из результата мы видим, что единственное значение p меньше 0,05 — это разница между методом и методом 3.

Итак, еще раз, мы пришли бы к выводу, что существует только статистически значимая разница в средних баллах на экзамене между студентами, которые использовали Методику 1 и Методику 3.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация об ANOVA и апостериорном тестировании:

Как интерпретировать значение F и значение P в ANOVA
Полное руководство: Как сообщить о результатах ANOVA
Тьюки против. Бонферрони против. Шеффе: какой тест следует использовать?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *