Повний посібник: перевірка гіпотез у r
Перевірка гіпотези — це формальний статистичний тест, який ми використовуємо, щоб відхилити або не відхилити статистичну гіпотезу.
У цьому підручнику пояснюється, як виконувати такі перевірки гіпотез у R:
- Зразок t тесту
- Двовибірковий Т-тест
- Т-критерій парних вибірок
Ми можемо використовувати функцію t.test() у R для виконання кожного типу тесту:
#one sample t-test t. test (x, y = NULL, alternative = c(" two.sided ", " less ", " greater "), mu = 0, paired = FALSE, var.equal = FALSE , conf.level = 0.95, …)
золото:
- x, y: дві вибірки даних.
- альтернатива: альтернативна гіпотеза тесту.
- mu: Справжнє значення середнього.
- paired: чи потрібно виконувати парний t-тест.
- var.equal: чи припускати, що дисперсії рівні між вибірками.
- conf.level: рівень надійності для використання.
Наступні приклади показують, як використовувати цю функцію на практиці.
Приклад 1: одновибірковий t-тест у R
Одновибірковий t-критерій використовується, щоб перевірити, чи дорівнює середнє значення генеральної сукупності певному значенню.
Наприклад, скажімо, ми хочемо знати, чи становить середня вага певного виду черепах 310 фунтів. Ми виходимо і збираємо просту випадкову вибірку черепах з такими вагами:
Вага : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
Наступний код показує, як виконати цей приклад t-тесту в R:
#define vector of turtle weights turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) #perform one sample t-test t. test (x=turtle_weights,mu=310) One Sample t-test data: turtle_weights t = -1.5848, df = 12, p-value = 0.139 alternative hypothesis: true mean is not equal to 310 95 percent confidence interval: 303.4236 311.0379 sample estimates: mean of x 307.2308
З результату ми бачимо:
- t-критерій статистики: -1,5848
- ступенів свободи: 12
- p-значення: 0,139
- 95% довірчий інтервал для справжнього середнього: [303,4236, 311,0379]
- середня вага черепах: 307 230
Оскільки p-значення тесту (0,139) не менше 0,05, ми не можемо відхилити нульову гіпотезу.
Це означає, що у нас недостатньо доказів, щоб стверджувати, що середня вага цього виду черепах є чимось іншим, ніж 310 фунтів.
Приклад 2: двовибірковий t-тест у R
Двовибірковий t-критерій використовується, щоб перевірити, чи рівні середні дві сукупності чи ні.
Наприклад, припустімо, що ми хочемо знати, чи однакова середня вага двох різних видів черепах. Щоб перевірити це, ми збираємо просту випадкову вибірку черепах кожного виду з такими вагами:
Зразок 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
Зразок 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305
Наступний код показує, як виконати ці два приклади t-тесту в R:
#define vector of turtle weights for each sample sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305) #perform two sample t-tests t. test (x = sample1, y = sample2) Welch Two Sample t-test data: sample1 and sample2 t = -2.1009, df = 19.112, p-value = 0.04914 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -14.73862953 -0.03060124 sample estimates: mean of x mean of y 307.2308 314.6154
З результату ми бачимо:
- t-критерій статистики: -2,1009
- ступенів свободи: 19,112
- p-значення: 0,04914
- 95% довірчий інтервал для справжньої середньої різниці: [-14,74, -0,03]
- середня маса зразка 1: 307,2308
- середня маса зразка 2: 314,6154
Оскільки p-значення тесту (0,04914) менше 0,05, ми відхиляємо нульову гіпотезу.
Це означає, що ми маємо достатньо доказів, щоб стверджувати, що середня вага між двома видами не однакова.
Приклад 3: t-критерій парних вибірок у R
Т-критерій для парних вибірок використовується для порівняння середніх значень двох вибірок, коли кожне спостереження в одній вибірці можна пов’язати зі спостереженням в іншій вибірці.
Наприклад, скажімо, ми хочемо знати, чи здатна певна тренувальна програма збільшити максимальний вертикальний стрибок (у дюймах) баскетболістів.
Щоб перевірити це, ми можемо набрати просту випадкову вибірку з 12 студентів-баскетболістів і виміряти кожен з їхніх максимальних вертикальних стрибків. Тоді ми можемо запропонувати кожному гравцю використовувати тренувальну програму протягом місяця, а потім знову виміряти їхній максимальний вертикальний стрибок наприкінці місяця.
Наступні дані показують максимальну висоту стрибка (у дюймах) до та після використання програми тренувань для кожного гравця:
Спереду : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21
Після : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20
Наступний код показує, як виконати цей t-тест парних вибірок у R:
#define before and after max jump heights before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21) after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20) #perform paired samples t-test t. test (x = before, y = after, paired = TRUE ) Paired t-test data: before and after t = -2.5289, df = 11, p-value = 0.02803 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.3379151 -0.1620849 sample estimates: mean of the differences -1.25
З результату ми бачимо:
- t-критерій статистики: -2,5289
- ступенів свободи: 11
- p-значення: 0,02803
- 95% довірчий інтервал для справжньої середньої різниці: [-2,34, -0,16]
- середня різниця між до і після: -1,25
Оскільки p-значення тесту (0,02803) менше 0,05, ми відхиляємо нульову гіпотезу.
Це означає, що ми маємо достатньо доказів, щоб стверджувати, що середня висота стрибка до і після використання програми тренувань не однакова.
Додаткові ресурси
Використовуйте такі онлайн-калькулятори для автоматичного виконання різних t-тестів:
Приклад калькулятора t-тесту
Калькулятор двовибіркового t-тесту
Калькулятор t-критерію парних зразків