Как выполнить двухвыборочный t-тест в r


Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей или нет.

Вы можете использовать следующий базовый синтаксис для выполнения t-теста с двумя примерами в R:

 t. test (group1, group2, var. equal = TRUE ) 

Примечание . Указывая var.equal=TRUE , мы сообщаем R, что дисперсии между двумя выборками равны.

Если вы не хотите делать такое предположение, просто оставьте этот аргумент в стороне, и вместо этого R выполнит t-критерий Уэлча , который не предполагает, что дисперсии между выборками равны.

В следующем примере показано, как на практике выполнить двухвыборочный t-критерий в R.

Пример: двухвыборочный T-критерий в R

Предположим, мы хотим знать, имеют ли два разных вида растений одинаковую среднюю высоту.

Чтобы проверить это, мы собираем простую случайную выборку из 12 растений каждого вида.

Следующий код показывает, как выполнить t-критерий с двумя выборками в R, чтобы определить, равен ли средний рост между двумя видами:

 #create vectors to hold plant heights from each sample
group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19)
group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19)

#perform two sample t-tests
t. test (group1, group2, var. equal = TRUE )

	Two Sample t-test

data: group1 and group2
t = -2.5505, df = 22, p-value = 0.01823
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -5.5904820 -0.5761847
sample estimates:
mean of x mean of y 
 11.66667 14.75000 

Вот как интерпретировать результаты теста:

данные: имена векторов, содержащих образцы данных.

t: статистика t-теста. В данном случае это -2,5505 .

df : Степени свободы, рассчитанные как n 1 + n 2 – 2 = 12 + 12 – 2 = 22 .

Значение p: значение p, соответствующее тестовой статистике -2,5505 и df = 22. Значение p оказывается равным 0,01823 . Мы можем подтвердить это значение с помощью калькулятора T Score to P Value .

95% доверительный интервал: 95% доверительный интервал для истинной разницы в средних значениях между двумя группами. Оказывается, это [-5.59, -.576] .

выборочные оценки: выборочное среднее каждой группы. В этом случае среднее значение выборки для группы 1 составило 11,667 , а среднее значение выборки для группы 2 составило 14,75 .

Нулевая и альтернативная гипотезы для этого конкретного двухвыборочного t-критерия заключаются в следующем:

H 0 : µ 1 = µ 2 (два средних значения совокупности равны)

H A : µ 1 ≠ µ 2 (два средних значения совокупности не равны)

Если значение p нашего теста (0,01823) меньше 0,05, мы отвергаем нулевую гипотезу.

Это означает, что у нас есть достаточно доказательств, чтобы сделать вывод о том, что средняя высота растений этих двух видов не одинакова.

Технические примечания

Функция t.test() в R использует следующий синтаксис:

 t. test (x, y, alternative="two.sided", mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)

Золото:

  • x, y: имена двух векторов, содержащих данные.
  • Альтернатива: Альтернативная гипотеза. Возможные варианты: «двусторонний», «меньше» или «больше».
  • mu: Предполагается, что значение является истинной разницей средних значений.
  • парный: следует ли использовать парный t-критерий.
  • var.equal: равны ли различия между двумя группами.
  • conf.level: уровень достоверности, используемый для теста.

Не стесняйтесь изменять любой из этих аргументов при выполнении собственного t-теста в зависимости от конкретного теста, который вы хотите выполнить.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как выполнить одновыборочный T-тест в R
Как выполнить Т-тест Уэлча в R
Как выполнить t-тест парных выборок в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *