Повний посібник: як інтерпретувати результати t-тесту в r
Двовибірковий t-критерій використовується, щоб перевірити, чи рівні середні дві сукупності чи ні.
Цей підручник містить повний посібник щодо інтерпретації результатів двовибіркового t-критерію в R.
Крок 1: Створіть дані
Припустімо, ми хочемо знати, чи два різні види рослин мають однакову середню висоту. Щоб перевірити це, ми збираємо просту випадкову вибірку з 12 рослин кожного виду.
#create vector of plant heights from group 1 group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) #create vector of plant heights from group 2 group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19)
Крок 2: Виконайте та інтерпретуйте двовибірковий t-тест
Далі ми використаємо команду t.test() , щоб виконати два приклади t-тесту:
#perform two sample t-tests t. test (group1, group2) Welch Two Sample t-test data: group1 and group2 t = -2.5505, df = 20.488, p-value = 0.01884 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.6012568 -0.5654098 sample estimates: mean of x mean of y 11.66667 14.75000
Ось як інтерпретувати результати тесту:
дані: це повідомляє нам про дані, які використовувалися в двовибірковому t-критерії. У цьому випадку ми використали вектори під назвою group1 і group2.
t: це t-критерій статистики. У цьому випадку це -2,5505 .
df : це ступені свободи, пов’язані зі статистикою t-тесту. У цьому випадку це 20 488 . Зверніться до апроксимації Саттертвейра , щоб отримати пояснення того, як обчислюється це значення ступенів свободи.
p-value: це p-value, яке відповідає тестовій статистиці -2,5505 і df = 20,488. P-значення виявляється рівним 0,01884 . Ми можемо підтвердити це значення за допомогою калькулятора T Score to P Value .
альтернативна гіпотеза: Це говорить нам про альтернативну гіпотезу, яка використовується для цього конкретного t-тесту. У цьому випадку альтернативна гіпотеза полягає в тому, що справжня різниця середніх значень між двома групами не дорівнює нулю.
95% довірчий інтервал: це говорить нам про 95% довірчий інтервал для справжньої різниці середніх значень між двома групами. Виявляється [-5,601, -,5654] .
вибіркові оцінки: це говорить нам про вибіркове середнє для кожної групи. У цьому випадку середнє значення вибірки для групи 1 становило 11,667 , а середнє значення вибірки для групи 2 становило 14,75 .
Два припущення для цього конкретного двовибіркового t-тесту:
H 0 : µ 1 = µ 2 (два середні сукупності рівні)
H A : µ 1 ≠µ 2 (два середні сукупності не рівні)
Оскільки p-значення нашого тесту (0,01884) менше, ніж альфа = 0,05, ми відхиляємо нульову гіпотезу тесту. Це означає, що ми маємо достатньо доказів, щоб стверджувати, що середня висота рослин у двох популяціях різна.
Коментарі
Функція t.test() у R використовує такий синтаксис:
t.test(x, y, alternative = “два боки”, mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0,95)
золото:
- x, y: імена двох векторів, які містять дані.
- альтернатива: альтернативна гіпотеза. Варіанти включають «двостороннє», «менше» або «більше».
- mu: значення, яке вважається справжньою різницею середніх.
- paired: використовувати чи ні парний t-тест.
- var.equal: чи рівні різниці між двома групами.
- conf.level: рівень достовірності для тесту.
У нашому прикладі вище ми використовували такі припущення:
- Ми використали двосторонню альтернативну гіпотезу.
- Ми перевірили, чи справжня різниця середніх значень дорівнює нулю.
- Ми використовували двовибірковий t-тест, а не парний t-тест.
- Ми не припускали, що відмінності між групами однакові .
- Ми використовували рівень довіри 95%.
Не соромтеся змінити будь-який із цих аргументів під час виконання власного t-тесту, залежно від конкретного тесту, який ви бажаєте виконати.
Додаткові ресурси
Вступ до двовибіркового t-тесту
Калькулятор двовибіркового t-тесту