Полное руководство: проверка гипотез в r


Проверка гипотезы — это формальный статистический тест, который мы используем, чтобы отвергнуть или не отвергнуть статистическую гипотезу.

В этом руководстве объясняется, как выполнить следующие проверки гипотез в R:

  • Образец t-теста
  • Двухвыборочный Т-тест
  • Парные выборки t-критерий

Мы можем использовать функцию t.test() в R для выполнения каждого типа теста:

 #one sample t-test
t. test (x, y = NULL,
       alternative = c(" two.sided ", " less ", " greater "),
       mu = 0, paired = FALSE, var.equal = FALSE ,
       conf.level = 0.95, …)

Золото:

Следующие примеры показывают, как использовать эту функцию на практике.

Пример 1: Одновыборочный t-критерий в R

Одновыборочный t-критерий используется для проверки того, соответствует ли среднее значение совокупности определенному значению.

Например, предположим, что мы хотим знать, составляет ли средний вес черепах определенного вида 310 фунтов. Мы выходим и собираем простую случайную выборку черепах со следующими весами:

Вес : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303.

Следующий код показывает, как выполнить этот пример t-теста в R:

 #define vector of turtle weights
turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)

#perform one sample t-test
t. test (x=turtle_weights,mu=310)

	One Sample t-test

data: turtle_weights
t = -1.5848, df = 12, p-value = 0.139
alternative hypothesis: true mean is not equal to 310
95 percent confidence interval:
 303.4236 311.0379
sample estimates:
mean of x 
 307.2308

По результату мы видим:

  • статистика t-теста: -1,5848
  • степеней свободы: 12
  • р-значение: 0,139
  • 95% доверительный интервал для истинного среднего значения: [303,4236, 311,0379]
  • средний вес черепах: 307 230

Поскольку значение p теста (0,139) не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что у нас нет достаточных доказательств, чтобы сказать, что средний вес этого вида черепах не превышает 310 фунтов.

Пример 2: Двухвыборочный t-критерий в R

Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей или нет.

Например, предположим, что мы хотим узнать, равен ли средний вес двух разных видов черепах. Чтобы проверить это, мы собираем простую случайную выборку черепах каждого вида со следующими весами:

Образец 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303.

Образец 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305.

Следующий код показывает, как выполнить эти два примера t-теста в R:

 #define vector of turtle weights for each sample
sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)
sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305)

#perform two sample t-tests
t. test (x = sample1, y = sample2)

	Welch Two Sample t-test

data: sample1 and sample2
t = -2.1009, df = 19.112, p-value = 0.04914
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.73862953 -0.03060124
sample estimates:
mean of x mean of y 
 307.2308 314.6154

По результату мы видим:

  • статистика t-теста: -2,1009
  • степени свободы: 19 112
  • p-значение: 0,04914
  • 95% доверительный интервал для истинной средней разницы: [-14,74, -0,03]
  • средний вес образца 1: 307,2308
  • средний вес образца 2: 314,6154

Поскольку значение p теста (0,04914) меньше 0,05, мы отвергаем нулевую гипотезу.

Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средний вес между двумя видами не равен.

Пример 3: t-критерий для парных выборок в R

T-критерий парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть связано с наблюдением в другой выборке.

Например, предположим, что мы хотим знать, способна ли определенная программа тренировок увеличить максимальный вертикальный прыжок (в дюймах) баскетболистов.

Чтобы проверить это, мы можем набрать простую случайную выборку из 12 баскетболистов колледжей и измерить каждый из их максимальных вертикальных прыжков. Затем мы можем предложить каждому игроку использовать программу тренировок в течение месяца, а затем в конце месяца снова измерить его максимальный вертикальный прыжок.

Следующие данные показывают максимальную высоту прыжка (в дюймах) до и после использования тренировочной программы для каждого игрока:

Передние : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21.

Через : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20.

Следующий код показывает, как выполнить этот t-тест для парных выборок в R:

 #define before and after max jump heights
before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21)
after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20)

#perform paired samples t-test
t. test (x = before, y = after, paired = TRUE )

	Paired t-test

data: before and after
t = -2.5289, df = 11, p-value = 0.02803
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.3379151 -0.1620849
sample estimates:
mean of the differences 
                  -1.25

По результату мы видим:

  • статистика t-теста: -2,5289
  • степеней свободы: 11
  • p-значение: 0,02803
  • 95% доверительный интервал для истинной средней разницы: [-2,34, -0,16]
  • средняя разница между до и после: -1,25

Поскольку значение p теста (0,02803) меньше 0,05, мы отвергаем нулевую гипотезу.

Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средняя высота прыжка до и после использования тренировочной программы не одинакова.

Дополнительные ресурсы

Используйте следующие онлайн-калькуляторы для автоматического выполнения различных t-тестов:

Пример калькулятора t-теста
Калькулятор двухвыборочного t-критерия
Калькулятор t-теста для парных выборок

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *