Как выполнить t-критерий уэлча в r


T-критерий Уэлча используется для сравнения средних значений между двумя независимыми группами, когда не предполагается, что эти две группы имеют равные дисперсии.

Чтобы выполнить t-тест Уэлча в R, мы можем использовать функцию t.test() , которая использует следующий синтаксис:

t.test(x, y, альтернатива = c («два лица», «меньше», «больше»))

Золото:

  • x: числовой вектор значений данных для первой группы
  • y: числовой вектор значений данных для второй группы
  • Альтернатива: альтернативная гипотеза для теста. По умолчанию двусторонний.

В следующем примере показано, как использовать эту функцию для выполнения t-критерия Уэлча в R.

Пример: t-критерий Уэлча в R

Учитель хочет сравнить результаты экзамена 12 учеников, которые использовали буклет для подготовки к экзамену, с результатами 12 учеников, которые этого не сделали.

Следующие векторы показывают результаты экзаменов учащихся в каждой группе:

 booklet <- c(90, 85, 88, 89, 94, 91, 79, 83, 87, 88, 91, 90)
no_booklet <- c(67, 90, 71, 95, 88, 83, 72, 66, 75, 86, 93, 84)

Прежде чем выполнять t-критерий Уэлча, мы можем сначала создать коробчатые диаграммы , чтобы визуализировать распределение оценок для каждой группы:

 boxplot(booklet, no_booklet, names =c(" Booklet "," No Booklet "))

t-критерий Уэлча в R

Мы ясно видим, что группа «Буклет» имеет более высокий средний балл и меньшую дисперсию баллов.

Чтобы формально проверить, существенно ли различаются средние баллы между группами, мы можем выполнить t-критерий Уэлча:

 #perform Welch's t-test
t.test(booklet, no_booklet)

	Welch Two Sample t-test

data: booklet and no_booklet
t = 2.2361, df = 14.354, p-value = 0.04171
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  0.3048395 13.8618272
sample estimates:
mean of x mean of y 
 87.91667 80.83333 

Из результата мы видим, что статистика t -теста равна 2,2361 , а соответствующее значение p — 0,04171 .

Поскольку это значение p меньше 0,05, мы можем отвергнуть нулевую гипотезу и заключить, что существует статистически значимая разница в средних баллах на экзамене между двумя группами.

Функция t.test() также предоставляет нам следующую информацию:

  • 95% доверительный интервал для разницы в средних баллах на экзамене между двумя группами составляет [0,3048, 13,8618 ].
  • Средний балл экзамена первой группы — 87,91667 .
  • Средний балл экзамена второй группы — 80,83333 .

Полную документацию по функции t.test() вы можете найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как выполнить одновыборочный t-тест в R
Как выполнить двухвыборочный t-тест в R
Как выполнить t-тест парных выборок в R
Как построить несколько коробчатых диаграмм на одном графике в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *