Полное руководство: проверка гипотез в r
Проверка гипотезы — это формальный статистический тест, который мы используем, чтобы отвергнуть или не отвергнуть статистическую гипотезу.
В этом руководстве объясняется, как выполнить следующие проверки гипотез в R:
- Образец t-теста
- Двухвыборочный Т-тест
- Парные выборки t-критерий
Мы можем использовать функцию t.test() в R для выполнения каждого типа теста:
#one sample t-test t. test (x, y = NULL, alternative = c(" two.sided ", " less ", " greater "), mu = 0, paired = FALSE, var.equal = FALSE , conf.level = 0.95, …)
Золото:
- x, y: две выборки данных.
- Альтернатива: Альтернативная гипотеза теста.
- mu: Истинное среднее значение.
- парный: следует ли выполнять парный t-тест.
- var.equal: следует ли предполагать, что дисперсии между выборками равны .
- conf.level: используемый уровень достоверности .
Следующие примеры показывают, как использовать эту функцию на практике.
Пример 1: Одновыборочный t-критерий в R
Одновыборочный t-критерий используется для проверки того, соответствует ли среднее значение совокупности определенному значению.
Например, предположим, что мы хотим знать, составляет ли средний вес черепах определенного вида 310 фунтов. Мы выходим и собираем простую случайную выборку черепах со следующими весами:
Вес : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303.
Следующий код показывает, как выполнить этот пример t-теста в R:
#define vector of turtle weights turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) #perform one sample t-test t. test (x=turtle_weights,mu=310) One Sample t-test data: turtle_weights t = -1.5848, df = 12, p-value = 0.139 alternative hypothesis: true mean is not equal to 310 95 percent confidence interval: 303.4236 311.0379 sample estimates: mean of x 307.2308
По результату мы видим:
- статистика t-теста: -1,5848
- степеней свободы: 12
- р-значение: 0,139
- 95% доверительный интервал для истинного среднего значения: [303,4236, 311,0379]
- средний вес черепах: 307 230
Поскольку значение p теста (0,139) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.
Это означает, что у нас нет достаточных доказательств, чтобы сказать, что средний вес этого вида черепах не превышает 310 фунтов.
Пример 2: Двухвыборочный t-критерий в R
Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей или нет.
Например, предположим, что мы хотим узнать, равен ли средний вес двух разных видов черепах. Чтобы проверить это, мы собираем простую случайную выборку черепах каждого вида со следующими весами:
Образец 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303.
Образец 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305.
Следующий код показывает, как выполнить эти два примера t-теста в R:
#define vector of turtle weights for each sample sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305) #perform two sample t-tests t. test (x = sample1, y = sample2) Welch Two Sample t-test data: sample1 and sample2 t = -2.1009, df = 19.112, p-value = 0.04914 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -14.73862953 -0.03060124 sample estimates: mean of x mean of y 307.2308 314.6154
По результату мы видим:
- статистика t-теста: -2,1009
- степени свободы: 19 112
- p-значение: 0,04914
- 95% доверительный интервал для истинной средней разницы: [-14,74, -0,03]
- средний вес образца 1: 307,2308
- средний вес образца 2: 314,6154
Поскольку значение p теста (0,04914) меньше 0,05, мы отвергаем нулевую гипотезу.
Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средний вес между двумя видами не равен.
Пример 3: t-критерий для парных выборок в R
T-критерий парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть связано с наблюдением в другой выборке.
Например, предположим, что мы хотим знать, способна ли определенная программа тренировок увеличить максимальный вертикальный прыжок (в дюймах) баскетболистов.
Чтобы проверить это, мы можем набрать простую случайную выборку из 12 баскетболистов колледжей и измерить каждый из их максимальных вертикальных прыжков. Затем мы можем предложить каждому игроку использовать программу тренировок в течение месяца, а затем в конце месяца снова измерить его максимальный вертикальный прыжок.
Следующие данные показывают максимальную высоту прыжка (в дюймах) до и после использования тренировочной программы для каждого игрока:
Передние : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21.
Через : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20.
Следующий код показывает, как выполнить этот t-тест для парных выборок в R:
#define before and after max jump heights before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21) after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20) #perform paired samples t-test t. test (x = before, y = after, paired = TRUE ) Paired t-test data: before and after t = -2.5289, df = 11, p-value = 0.02803 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.3379151 -0.1620849 sample estimates: mean of the differences -1.25
По результату мы видим:
- статистика t-теста: -2,5289
- степеней свободы: 11
- p-значение: 0,02803
- 95% доверительный интервал для истинной средней разницы: [-2,34, -0,16]
- средняя разница между до и после: -1,25
Поскольку значение p теста (0,02803) меньше 0,05, мы отвергаем нулевую гипотезу.
Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средняя высота прыжка до и после использования тренировочной программы не одинакова.
Дополнительные ресурсы
Используйте следующие онлайн-калькуляторы для автоматического выполнения различных t-тестов:
Пример калькулятора t-теста
Калькулятор двухвыборочного t-критерия
Калькулятор t-теста для парных выборок