Як виконати t-тест із двома зразками в r
Двовибірковий t-критерій використовується, щоб перевірити, чи рівні середні дві сукупності чи ні.
Ви можете використовувати наступний базовий синтаксис, щоб виконати два приклади t-тесту в R:
t. test (group1, group2, var. equal = TRUE )
Примітка : вказуючи var.equal=TRUE , ми повідомляємо R припустити, що дисперсії між двома вибірками рівні.
Якщо ви не хочете робити це припущення, просто залиште цей аргумент осторонь, і R натомість виконає t-критерій Велча , який не передбачає, що дисперсії рівні між вибірками.
У наступному прикладі показано, як на практиці виконати двовибірковий t-тест у R.
Приклад: двовибірковий T-тест у R
Припустімо, ми хочемо знати, чи два різні види рослин мають однакову середню висоту.
Щоб перевірити це, ми збираємо просту випадкову вибірку з 12 рослин кожного виду.
У наведеному нижче коді показано, як виконати двовибірковий t-тест у R, щоб визначити, чи є середній зріст однаковим для двох видів:
#create vectors to hold plant heights from each sample group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19) #perform two sample t-tests t. test (group1, group2, var. equal = TRUE ) Two Sample t-test data: group1 and group2 t = -2.5505, df = 22, p-value = 0.01823 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.5904820 -0.5761847 sample estimates: mean of x mean of y 11.66667 14.75000
Ось як інтерпретувати результати тесту:
дані: імена векторів, які містять вибіркові дані.
t: статистика тесту t. У цьому випадку це -2,5505 .
df : Ступені свободи, розраховані як n 1 + n 2 – 2 = 12 + 12 – 2 = 22 .
p-value: p-value, яке відповідає тестовій статистиці -2,5505 і df = 22. P-value виявляється рівним 0,01823 . Ми можемо підтвердити це значення за допомогою калькулятора T Score to P Value .
95% довірчий інтервал: 95% довірчий інтервал для справжньої різниці середніх значень між двома групами. Виявляється [-5,59, -,576] .
вибіркові оцінки: вибіркове середнє для кожної групи. У цьому випадку середнє значення вибірки для групи 1 становило 11,667 , а середнє значення вибірки для групи 2 становило 14,75 .
Нульова та альтернативна гіпотези для цього конкретного двовибіркового t-критерію такі:
H 0 : µ 1 = µ 2 (два середні сукупності рівні)
H A : µ 1 ≠µ 2 (два середні сукупності не рівні)
Якщо p-значення нашого тесту (0,01823) менше 0,05, ми відхиляємо нульову гіпотезу.
Це означає, що ми маємо достатньо доказів, щоб зробити висновок, що середня висота рослин у двох видів не однакова.
Технічні примітки
Функція t.test() у R використовує такий синтаксис:
t. test (x, y, alternative="two.sided", mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)
золото:
- x, y: імена двох векторів, які містять дані.
- альтернатива: альтернативна гіпотеза. Варіанти включають «двостороннє», «менше» або «більше».
- mu: значення, яке вважається справжньою різницею середніх.
- paired: використовувати чи ні парний t-тест.
- var.equal: чи рівні різниці між двома групами.
- conf.level: рівень достовірності для тесту.
Не соромтеся змінити будь-який із цих аргументів під час виконання власного t-тесту, залежно від конкретного тесту, який ви бажаєте виконати.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в R:
Як виконати T-тест з одним зразком у R
Як виконати Т-тест Велча в R
Як виконати t-тест парних зразків у R