Як виконувати постгок попарні порівняння в r


Односторонній дисперсійний аналіз використовується для визначення того, чи існує статистично значуща різниця між середніми значеннями трьох або більше незалежних груп.

Односторонній ANOVA використовує такі нульові та альтернативні гіпотези:

  • H 0 : Усі групові середні рівні.
  • H A : Не всі середні показники групи однакові.

Якщо загальне p-значення дисперсійного аналізу є нижчим за певний рівень значущості (наприклад, α = 0,05), тоді ми відхиляємо нульову гіпотезу та робимо висновок, що всі групові середні не рівні.

Щоб з’ясувати, які групові середні відрізняються, ми можемо виконати пост-гок попарні порівняння .

У наведеному нижче прикладі показано, як виконати наступні постгок попарні порівняння в R:

  • Метод Тьюкі
  • Метод Шеффе
  • Метод Бонферроні
  • Метод Холма

Приклад: односторонній дисперсійний аналіз R

Припустімо, що вчитель хоче знати, чи призводять три різні методи навчання до різних результатів тестів серед учнів. Щоб перевірити це, вона випадковим чином призначає 10 студентів для використання кожної методики навчання та записує їхні результати іспитів.

Ми можемо використати наступний код у R, щоб виконати односторонній дисперсійний аналіз, щоб перевірити різницю в середніх балах за іспит між трьома групами:

 #create data frame
df <- data.frame(technique = rep(c(" tech1 ", " tech2 ", " tech3 "), each= 10 ),
                 score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89,
                           81, 82, 83, 83, 83, 84, 87, 90, 92, 93,
                           77, 78, 79, 88, 89, 90, 91, 95, 95, 98))

#perform one-way ANOVA
model <- aov(score ~ technique, data = df)

#view output of ANOVA
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)  
technical 2 211.5 105.73 3.415 0.0476 *
Residuals 27 836.0 30.96                 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Загальне значення p дисперсійного аналізу (0,0476) менше, ніж α = 0,05, тому ми відхилимо нульову гіпотезу про те, що середній бал іспиту є однаковим для кожної методики дослідження.

Ми можемо робити пост-гок попарні порівняння, щоб визначити, які групи мають різні середні значення.

Метод Тьюкі

Найкраще використовувати post hoc метод Тьюкі, коли розмір вибірки кожної групи однаковий.

Ми можемо використовувати вбудовану функцію TukeyHSD() для виконання пост-хок методу Tukey в R:

 #perform the Tukey post-hoc method
TukeyHSD(model, conf. level = .95 )

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = score ~ technique, data = df)

$technical
            diff lwr upr p adj
tech2-tech1 4.2 -1.9700112 10.370011 0.2281369
tech3-tech1 6.4 0.2299888 12.570011 0.0409017
tech3-tech2 2.2 -3.9700112 8.370011 0.6547756

З результату ми бачимо, що єдине значення p (“ p adj ”), менше ніж 0,05, є різницею між технікою та технікою 3.

Таким чином, ми дійшли висновку, що існує лише статистично значуща різниця в середніх результатах іспиту між студентами, які використовували техніку 1 і техніку 3.

Метод Шеффе

Метод Шеффе є найбільш консервативним пост-hoc методом попарного порівняння та дає найширші довірчі інтервали при порівнянні групових середніх.

Ми можемо використати функцію ScheffeTest() із пакета DescTools для запуску методу Scheffe post-hoc у R:

 library (DescTools)

#perform the Scheffe post-hoc method
ScheffeTest(model)

  Posthoc multiple comparisons of means: Scheffe Test 
    95% family-wise confidence level

$technical
            diff lwr.ci upr.ci pval    
tech2-tech1 4.2 -2.24527202 10.645272 0.2582    
tech3-tech1 6.4 -0.04527202 12.845272 0.0519 .  
tech3-tech2 2.2 -4.24527202 8.645272 0.6803    

---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1'''156

З результатів ми бачимо, що немає значень p нижче 0,05, тому ми можемо зробити висновок, що немає статистично значущої різниці в середніх іспитових балах між групами.

Метод Бонферроні

Найкраще використовувати метод Бонферроні, коли ви хочете виконати набір запланованих попарних порівнянь.

Ми можемо використовувати наступний синтаксис у R для виконання методу Bonferroni post hoc:

 #perform the Bonferroni post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' bonferroni ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.309 -    
tech3 0.048 1.000

P value adjustment method: bonferroni

З результату ми бачимо, що єдине значення p менше 0,05 є різницею між технікою та технікою 3.

Таким чином, ми дійшли висновку, що існує лише статистично значуща різниця в середніх результатах іспиту між студентами, які використовували техніку 1 і техніку 3.

Метод Холма

Метод Холма також використовується, коли ви хочете заздалегідь виконати набір запланованих парних порівнянь, і він, як правило, має навіть більшу потужність, ніж метод Бонферроні, тому йому часто надають перевагу.

Ми можемо використовувати наступний синтаксис у R для запуску методу Holm post-hoc:

 #perform the Holm post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' holm ')

	Pairwise comparisons using t tests with pooled SD 

data: df$score and df$technique 

      tech1 tech2
tech2 0.206 -    
tech3 0.048 0.384

P value adjustment method: holm

З результату ми бачимо, що єдине значення p менше 0,05 є різницею між технікою та технікою 3.

Отже, знову ж таки, ми робимо висновок, що існує лише статистично значуща різниця в середніх результатах іспиту між студентами, які використовували Техніку 1 і Техніку 3.

Додаткові ресурси

У наведених нижче посібниках надається додаткова інформація про ANOVA та пост-хок тестування:

Як інтерпретувати значення F і P у ANOVA
Повний посібник: як звітувати про результати ANOVA
Туреччина проти Бонферроні проти Шеффе: який тест використовувати?

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *