Як виконати тест тьюкі в r


Односторонній дисперсійний аналіз використовується, щоб визначити, чи існує статистично значуща різниця між середніми значеннями трьох або більше незалежних груп.

Якщо загальне p-значення таблиці ANOVA нижче певного рівня значущості, тоді ми маємо достатньо доказів, щоб стверджувати, що принаймні одне з групових середніх відрізняється від інших.

Однак це не говорить нам , які групи відрізняються одна від одної. Це просто говорить нам про те, що не всі середні групові показники однакові. Для того, щоб точно знати, які групи відрізняються одна від одної, нам потрібно провести ретельний тест .

Одним із найбільш часто використовуваних репресивних тестів є тест Тьюкі , який дозволяє нам виконувати попарні порівняння між середніми значеннями кожної групи, одночасно контролюючи частоту помилок у групі .

Цей підручник пояснює, як виконати тест Tukey у R.

Примітка: якщо будь-яка з груп у вашому дослідженні вважається контрольною групою, ви повинні використовувати тест Даннетта як додатковий тест.

Приклад: тест Тьюкі в R

Крок 1. Підберіть модель ANOVA.

У наведеному нижче коді показано, як створити фальшивий набір даних із трьома групами (A, B і C) і підібрати односторонню модель ANOVA до даних, щоб визначити, чи рівні середні значення кожної групи:

 #make this example reproducible
set.seed(0)

#create data
data <- data.frame(group = rep (c("A", "B", "C"), each = 30),
                   values = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#view first six rows of data
head(data)

  group values
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458

#fit one-way ANOVA model
model <- aov (values~group, data=data)

#view the model output
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)    
group 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Ми бачимо, що загальне p-значення з таблиці ANOVA становить 7,55e-11 . Оскільки це число менше 0,05, у нас є достатньо доказів, щоб стверджувати, що середні значення в кожній групі не однакові. Отже, ми можемо виконати тест Тьюкі, щоб точно визначити, які групові середні відрізняються.

Крок 2: Виконайте тест Тьюкі.

У наступному коді показано, як використовувати функцію TukeyHSD() для виконання тесту Tukey:

 #perform Tukey's Test
TukeyHSD(model, conf.level= .95 ) 

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = values ~ group, data = data)

$group
         diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199

P-значення вказує на те, чи є статистично значуща різниця між кожною програмою. Результати показують, що існує статистично значуща різниця між середньою втратою ваги в кожній програмі на рівні значущості 0,05.

Особливо:

  • Значення P для різниці середніх між B і A: 0,0100545
  • Значення P для різниці середніх між C і A: 0,0000000
  • Значення P для різниці середніх між C і B: 0,0000199

Крок 3: Візуалізуйте результати.

Ми також можемо використовувати функцію plot(TukeyHSD()) для візуалізації довірчих інтервалів:

 #plot confidence intervals
plot(TukeyHSD(model, conf.level= .95 ), las = 2 )

Примітка. Аргумент las визначає, що мітки галочок мають бути перпендикулярними (las=2) до осі.

Тест Тьюкі в Р

Ми бачимо, що жоден із довірчих інтервалів для середнього значення між групами не містить нульового значення, що вказує на наявність статистично значущої різниці в середніх втратах між трьома групами. Це узгоджується з тим, що всі p-значення для наших перевірок гіпотез менше 0,05.

Для цього конкретного прикладу ми можемо зробити такий висновок:

  • Середні значення групи C значно перевищують середні значення груп A і B.
  • Середні значення групи В значно перевищують середні значення групи А.

Додаткові ресурси

Посібник із використання пост-хок тестування з ANOVA
Як виконати односторонній дисперсійний аналіз у R
Як виконати двосторонній дисперсійний аналіз у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *