Как выполнить t-тест с неравными размерами выборки


Когда речь идет о статистике, студенты часто задают следующий вопрос:

Можно ли провести t-критерий, если размеры выборки в каждой группе не равны?

Короткий ответ:

Да, вы можете выполнить t-тест, если размеры выборки не равны. Равные размеры выборки не являются одним из допущений, сделанных в t-критерии.

Настоящие проблемы возникают, когда две выборки не имеют равных дисперсий, что является одним из допущений, сделанных в t-тесте.

В этом случае вместо этого рекомендуется использовать t-критерий Уэлча , который не предполагает равные дисперсии.

В следующих примерах показано, как выполнять T-тесты с неравными размерами выборок, когда дисперсии равны, а когда нет.

Пример 1: Неравные размеры выборки и равные дисперсии

Предположим, мы администрируем две программы, призванные помочь студентам лучше сдать определенные экзамены.

Результаты приведены ниже:

Программа 1:

  • n (размер выборки): 500
  • х (среднее выборочное): 80
  • s (выборочное стандартное отклонение): 5

Программа 2:

  • n (размер выборки): 20
  • х (среднее выборочное): 85
  • s (выборочное стандартное отклонение): 5

Следующий код показывает, как создать коробчатую диаграмму в R для визуализации распределения баллов экзамена для каждой программы:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=5)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

Средний балл экзамена по программе 2 кажется выше, но разница в баллах экзамена между двумя программами примерно одинакова.

Следующий код показывает, как выполнить t-критерий независимых выборок с помощью t-критерия Уэлча:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -3.3348, df = 518, p-value = 0.0009148
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.111504 -1.580245
sample estimates:
mean of x mean of y 
 80.11322 83.95910

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -3.3735, df = 20.589, p-value = 0.00293
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.219551 -1.472199
sample estimates:
mean of x mean of y 
 80.11322 83.95910 

T-критерий независимых выборок возвращает значение p 0,0009 , а t-критерий Уэлча возвращает значение p 0,0029 .

Поскольку значение p каждого теста меньше 0,05, мы бы отклонили нулевую гипотезу в каждом тесте и пришли к выводу, что существует статистически значимая разница в средних баллах экзамена между двумя программами.

Несмотря на то, что размеры выборок неравны, t-критерий независимых выборок и t-критерий Уэлча дают одинаковые результаты, поскольку две выборки имели равные дисперсии.

Пример 2: Неравные размеры выборки и неравные дисперсии

Предположим, мы администрируем две программы, призванные помочь студентам лучше сдать определенные экзамены.

Результаты приведены ниже:

Программа 1:

  • n (размер выборки): 500
  • х (среднее выборочное): 80
  • s (выборочное стандартное отклонение): 25

Программа 2:

  • n (размер выборки): 20
  • х (среднее выборочное): 85
  • s (выборочное стандартное отклонение): 5

Следующий код показывает, как создать коробчатую диаграмму в R для визуализации распределения баллов экзамена для каждой программы:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=25)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

Средний балл экзамена по программе 2 кажется выше, но разница в баллах экзамена по программе 1 намного выше, чем по программе 2.

Следующий код показывает, как выполнить t-критерий независимых выборок с помощью t-критерия Уэлча:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -0.5988, df = 518, p-value = 0.5496
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.52474 7.73875
sample estimates:
mean of x mean of y 
  80.5661 83.9591

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -2.1338, df = 74.934, p-value = 0.03613
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.560690 -0.225296
sample estimates:
mean of x mean of y 
  80.5661 83.9591 

T-критерий независимых выборок возвращает значение p 0,5496 , а t-критерий Уэлча возвращает значение p 0,0361 .

t-критерий независимых выборок не способен обнаружить разницу в средних баллах на экзамене, но t-критерий Уэлча способен обнаружить статистически значимую разницу.

Поскольку две выборки имели неравные дисперсии, только t-критерий Уэлча смог обнаружить статистически значимую разницу в средних баллах на экзамене, поскольку этот тест не предполагает равные дисперсии между выборками .

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о t-тестах:

Введение в одновыборочный t-критерий
Введение в двухвыборочный t-критерий
Знакомство с t-критерием парных выборок

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *