Как выполнить t-критерий уэлча в r
T-критерий Уэлча используется для сравнения средних значений между двумя независимыми группами, когда не предполагается, что эти две группы имеют равные дисперсии.
Чтобы выполнить t-тест Уэлча в R, мы можем использовать функцию t.test() , которая использует следующий синтаксис:
t.test(x, y, альтернатива = c («два лица», «меньше», «больше»))
Золото:
- x: числовой вектор значений данных для первой группы
- y: числовой вектор значений данных для второй группы
- Альтернатива: альтернативная гипотеза для теста. По умолчанию двусторонний.
В следующем примере показано, как использовать эту функцию для выполнения t-критерия Уэлча в R.
Пример: t-критерий Уэлча в R
Учитель хочет сравнить результаты экзамена 12 учеников, которые использовали буклет для подготовки к экзамену, с результатами 12 учеников, которые этого не сделали.
Следующие векторы показывают результаты экзаменов учащихся в каждой группе:
booklet <- c(90, 85, 88, 89, 94, 91, 79, 83, 87, 88, 91, 90) no_booklet <- c(67, 90, 71, 95, 88, 83, 72, 66, 75, 86, 93, 84)
Прежде чем выполнять t-критерий Уэлча, мы можем сначала создать коробчатые диаграммы , чтобы визуализировать распределение оценок для каждой группы:
boxplot(booklet, no_booklet, names =c(" Booklet "," No Booklet "))
Мы ясно видим, что группа «Буклет» имеет более высокий средний балл и меньшую дисперсию баллов.
Чтобы формально проверить, существенно ли различаются средние баллы между группами, мы можем выполнить t-критерий Уэлча:
#perform Welch's t-test
t.test(booklet, no_booklet)
Welch Two Sample t-test
data: booklet and no_booklet
t = 2.2361, df = 14.354, p-value = 0.04171
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.3048395 13.8618272
sample estimates:
mean of x mean of y
87.91667 80.83333
Из результата мы видим, что статистика t -теста равна 2,2361 , а соответствующее значение p — 0,04171 .
Поскольку это значение p меньше 0,05, мы можем отвергнуть нулевую гипотезу и заключить, что существует статистически значимая разница в средних баллах на экзамене между двумя группами.
Функция t.test() также предоставляет нам следующую информацию:
- 95% доверительный интервал для разницы в средних баллах на экзамене между двумя группами составляет [0,3048, 13,8618 ].
- Средний балл экзамена первой группы — 87,91667 .
- Средний балл экзамена второй группы — 80,83333 .
Полную документацию по функции t.test() вы можете найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как выполнить одновыборочный t-тест в R
Как выполнить двухвыборочный t-тест в R
Как выполнить t-тест парных выборок в R
Как построить несколько коробчатых диаграмм на одном графике в R