Як виконати тест даннетта в r


Post hoc тест — це тип тесту, який виконується після дисперсійного аналізу , щоб визначити, які групові середні значення статистично суттєво відрізняються одне від одного.

Якщо одна з досліджуваних груп вважається контрольною , тоді ми повинні використовувати тест Даннетта як додатковий тест.

Цей підручник пояснює, як виконати тест Даннетта в R.

Приклад: тест Даннета в R

Припустімо, що вчитель хоче знати, чи можуть дві нові методи навчання покращити результати тестів її учнів. Щоб перевірити це, вона випадковим чином ділить свій клас із 30 учнів на такі три групи:

  • Контрольна група: 10 студентів
  • Новий технічний кабінет 1: 10 студентів
  • Новий технічний кабінет 2: 10 студентів

Після тижня використання призначеної методики навчання кожен студент складає той самий іспит.

Ми можемо використати наступні кроки в R, щоб створити набір даних, візуалізувати групові середні, виконати односторонній дисперсійний аналіз і, нарешті, виконати тест Даннета, щоб визначити, яка нова методика дослідження (якщо така є) дає інші результати порівняно з контрольною групою .

Крок 1: Створіть набір даних.

Наступний код показує, як створити набір даних, що містить результати іспитів усіх 30 студентів:

 #create data frame
data <- data.frame(technique = rep (c("control", "new1", "new2"), each = 10 ),
                   score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89,
                             81, 82, 83, 83, 83, 84, 87, 90, 92, 93,
                             77, 78, 79, 88, 89, 90, 91, 95, 95, 98))

#view first six rows of data frame
head(data)

  technical score
1 control 76
2 controls 77
3 controls 77
4 controls 81
5 controls 82
6 controls 82

Крок 2: Перегляньте результати іспиту для кожної групи.

У наведеному нижче коді показано, як створити коробкові діаграми для візуалізації розподілу результатів іспитів для кожної групи:

 boxplot(score ~ technique,
        data = data,
        main = "Exam Scores by Studying Technique",
        xlab = "Studying Technique",
        ylab = "Exam Scores",
        col = "steelblue",
        border = "black")

Лише з коробкових графіків ми бачимо, що розподіл іспитових балів дуже відрізняється для кожної методики навчання. Потім ми виконаємо односторонній дисперсійний аналіз, щоб визначити, чи є ці відмінності статистично значущими.

Пов’язане: Як побудувати кілька діаграм в одній діаграмі в R

Крок 3: Виконайте односторонній дисперсійний аналіз.

У наведеному нижче коді показано, як виконати односторонній дисперсійний аналіз, щоб перевірити різницю між середніми оцінками іспиту в кожній групі:

 #fit the one-way ANOVA model
model <- aov(score ~ technique, data = data)

#view model output
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)  
technical 2 211.5 105.73 3.415 0.0476 *
Residuals 27 836.0 30.96                 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Оскільки загальне значення p ( 0,0476 ) менше 0,05, це означає, що кожна група не має однакового середнього балу за іспит. Далі ми виконаємо тест Даннетта, щоб визначити, яка методика навчання дає середні результати іспитів, які відрізняються від результатів контрольної групи.

Крок 4: Виконайте тест Даннета.

Щоб виконати тест Dunnett у R, ми можемо використати функцію DunnettTest() із бібліотеки DescTools , яка використовує такий синтаксис:

Критерій Даннета (x, g)

золото:

  • x: числовий вектор значень даних (наприклад, результати іспиту)
  • g: вектор, що вказує назви груп (наприклад, метод дослідження)

Наступний код показує, як використовувати цю функцію для нашого прикладу:

 #load DescTools library
library(DescTools)

#perform Dunnett's Test
DunnettTest(x=data$score, g=data$technique)

  Dunnett's test for comparing several treatments with a control:  
    95% family-wise confidence level

$control
             diff lwr.ci upr.ci pval    
new1-control 4.2 -1.6071876 10.00719 0.1787    
new2-control 6.4 0.5928124 12.20719 0.0296 *  

---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1' '1.' 0.1 ' ' 1

Спосіб інтерпретації результату такий:

  • Середня різниця в іспитових балах між новою методикою дослідження 1 і контрольною групою становить 4,2. Відповідне значення p становить 0,1787 .
  • Середня різниця в іспитових балах між новою методикою навчання 2 і контрольною групою становить 6,4. Відповідне значення p становить 0,0296 .

Грунтуючись на результатах, ми можемо побачити, що вивчення Техніки 2 є єдиною технікою, яка дає середні оцінки іспиту, які значно (p = 0,0296) відрізняються від показників контрольної групи.

Додаткові ресурси

Вступ до одностороннього дисперсійного аналізу
Як виконати односторонній дисперсійний аналіз у R
Як виконати тест Тьюкі в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *