Полное руководство: как интерпретировать результаты t-теста в r
Двухвыборочный t-критерий используется для проверки того, равны ли средние значения двух совокупностей или нет.
В этом руководстве представлено полное руководство по интерпретации результатов двухвыборочного t-теста в R.
Шаг 1. Создайте данные
Предположим, мы хотим знать, имеют ли два разных вида растений одинаковую среднюю высоту. Чтобы проверить это, мы собираем простую случайную выборку из 12 растений каждого вида.
#create vector of plant heights from group 1 group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) #create vector of plant heights from group 2 group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19)
Шаг 2. Выполните и интерпретируйте двухвыборочный t-критерий.
Далее мы воспользуемся командой t.test() для выполнения t-теста с двумя примерами:
#perform two sample t-tests t. test (group1, group2) Welch Two Sample t-test data: group1 and group2 t = -2.5505, df = 20.488, p-value = 0.01884 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.6012568 -0.5654098 sample estimates: mean of x mean of y 11.66667 14.75000
Вот как интерпретировать результаты теста:
данные: это говорит нам о данных, которые использовались в двухвыборочном t-тесте. В данном случае мы использовали векторы, называемые group1 и group2.
t: Это статистика t-теста. В данном случае это -2,5505 .
df : Это степени свободы, связанные со статистикой t-критерия. В данном случае это 20 488 . Обратитесь к приближению Саттертуайра для объяснения того, как рассчитывается значение степеней свободы.
Значение p: это значение p, соответствующее тестовой статистике -2,5505 и df = 20,488. Значение p оказывается равным 0,01884 . Мы можем подтвердить это значение с помощью калькулятора T Score to P Value .
альтернативная гипотеза: это говорит нам об альтернативной гипотезе, используемой для этого конкретного t-теста. В этом случае альтернативная гипотеза состоит в том, что истинная разница в средних значениях между двумя группами не равна нулю.
95% доверительный интервал: это говорит нам о 95% доверительном интервале для истинной разницы в средних значениях между двумя группами. Оказывается, это [-5.601, -.5654] .
выборочные оценки: это говорит нам выборочное среднее значение каждой группы. В этом случае среднее значение выборки для группы 1 составило 11,667 , а среднее значение выборки для группы 2 составило 14,75 .
Два предположения для этого конкретного двухвыборочного t-теста:
H 0 : µ 1 = µ 2 (два средних значения совокупности равны)
H A : µ 1 ≠ µ 2 (два средних значения совокупности не равны)
Поскольку значение p нашего теста (0,01884) меньше альфа = 0,05, мы отвергаем нулевую гипотезу теста. Это означает, что у нас есть достаточно доказательств, чтобы сказать, что средняя высота растений между двумя популяциями различна.
Комментарии
Функция t.test() в R использует следующий синтаксис:
t.test(x, y, альтернатива = «две стороны», mu = 0, пары = ЛОЖЬ, var.equal = ЛОЖЬ, conf.level = 0,95)
Золото:
- x, y: имена двух векторов, содержащих данные.
- Альтернатива: Альтернативная гипотеза. Возможные варианты: «двусторонний», «меньше» или «больше».
- mu: Значение, которое считается истинной разницей средних.
- парный: следует ли использовать парный t-критерий.
- var.equal: равны ли различия между двумя группами.
- conf.level: уровень достоверности, используемый для теста.
В нашем примере выше мы использовали следующие предположения:
- Мы использовали двустороннюю альтернативную гипотезу.
- Мы проверили, равна ли истинная разница в средних значениях нулю.
- Мы использовали двухвыборочный t-критерий, а не парный t-критерий.
- Мы не предполагали, что различия между группами были одинаковыми .
- Мы использовали уровень достоверности 95%.
Не стесняйтесь изменять любой из этих аргументов при выполнении собственного t-теста в зависимости от конкретного теста, который вы хотите выполнить.
Дополнительные ресурсы
Введение в двухвыборочный t-критерий
Калькулятор t-теста для двух выборок