Т-тест уэлча: когда его использовать + примеры
Когда мы хотим сравнить средние значения двух независимых групп, мы можем выбирать между использованием двух разных тестов:
t-критерий Стьюдента: этот тест предполагает, что две группы данных выбраны из популяций, которые следуют нормальному распределению , и что две популяции имеют одинаковую дисперсию.
t-критерий Уэлча: этот тест предполагает, что обе группы данных выбраны из популяций, которые следуют нормальному распределению, но не предполагает, что эти две популяции имеют одинаковую дисперсию .
Разница между t-критерием Стьюдента и t-критерием Уэлча
Есть два различия в том, как выполняются t-критерий Стьюдента и t-критерий Уэлча:
- Тестовая статистика
- Степени свободы
Т-критерий Стьюдента:
Статистика теста: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
где x 1 и x 2 — средние значения выборки, n 1 и n 2 — размеры выборки для выборки 1 и выборки 2 соответственно, и где s p рассчитывается следующим образом:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
где s 1 2 и s 2 2 — выборочные дисперсии.
Степени свободы: n 1 + n 2 – 2
Т-тест Уэлча
Статистика теста: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Степени свободы: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Формула для расчета степеней свободы t-критерия Уэлча учитывает разницу между двумя стандартными отклонениями. Если две выборки имеют одинаковые стандартные отклонения, то степени свободы t-критерия Уэлча будут точно такими же, как и степени свободы t-критерия Стьюдента.
Как правило, стандартные отклонения для двух выборок не одинаковы, и поэтому степени свободы t-критерия Уэлча, как правило, меньше, чем степени свободы t-критерия Стьюдента.
Также важно отметить, что степени свободы в t-критерии Уэлча обычно не являются целыми числами. Если вы тестируете вручную, лучше всего округлить до наименьшего целого числа. Если вы используете статистическое программное обеспечение, такое как R , оно сможет предоставить десятичное значение степеней свободы.
Когда следует использовать t-критерий Уэлча?
Некоторые люди утверждают, что t-критерий Уэлча должен быть выбором по умолчанию для сравнения средних значений двух независимых групп, поскольку он работает лучше, чем t-критерий Стьюдента, когда размеры выборки и дисперсии между группами неравны, и дает идентичные результаты, когда размеры выборки не равны. разные. различия равны.
На практике, когда вы сравниваете средние значения двух групп, маловероятно, что стандартные отклонения каждой группы будут одинаковыми. Поэтому рекомендуется всегда использовать t-критерий Уэлча, чтобы вам не приходилось делать предположения о равенстве дисперсий.
Примеры использования t-критерия Уэлча
Далее мы проведем t-критерий Уэлча для следующих двух выборок, чтобы определить, значительно ли различаются их средние значения при уровне значимости 0,05:
Образец 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25.
Образец 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34.
Мы проиллюстрируем, как выполнить тест тремя различными способами:
- За руку
- Используйте Microsoft Excel
- Используйте язык статистического программирования R.
Т-тест Уэлча вручную
Чтобы выполнить t-критерий Уэлча вручную, нам сначала нужно найти средние значения выборки, дисперсии выборки и размеры выборки:
х1 – 19,27
х2 – 23,69
с 1 14 – 20:42
арт 2 2 – 83,23
№ 1 – 11
№ 2 – 13
Затем мы можем ввести эти числа, чтобы найти статистику теста:
Статистика теста: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Статистика теста: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538
Степени свободы: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Степени свободы: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Мы округляем этот результат до ближайшего целого числа, 18 .
Наконец, мы найдем критическое значение t в таблице распределения t, которое соответствует двустороннему тесту с альфа = 0,05 для 18 степеней свободы:
Критическое значение t равно 2,101 . Поскольку абсолютное значение нашей тестовой статистики (1,538) не превышает критического значения t, мы не можем отвергнуть нулевую гипотезу теста. Недостаточно доказательств, чтобы утверждать, что средства двух групп населения существенно различаются.
Т-критерий Уэлча с Excel
Чтобы выполнить t-критерий Уэлча в Excel, нам сначала необходимо загрузить бесплатное программное обеспечение Analysis ToolPak. Если вы еще не скачали его в Excel, я написал краткое руководство по его загрузке .
Загрузив Analysis ToolPak, вы можете выполнить следующие шаги, чтобы выполнить t-критерий Уэлча для наших двух образцов:
1. Введите данные. Введите значения данных для двух образцов в столбцы A и B и заголовки «Образец 1» и «Образец 2» в первую ячейку каждого столбца.
2. Выполните t-критерий Уэлча с помощью пакета Analysis ToolPak. Перейдите на вкладку «Данные» на верхней ленте. Затем в группе «Анализ» щелкните значок «Пакет инструментов анализа».
В появившемся диалоговом окне нажмите t-test: две выборки с учетом неравных отклонений , а затем нажмите кнопку ОК.
Наконец, заполните значения ниже и нажмите «ОК»:
Должен появиться следующий результат:
Обратите внимание, что результаты этого теста соответствуют результатам, полученным нами вручную:
- Статистика теста равна -1,5379 .
- Двустороннее критическое значение составляет 2,1009 .
- Поскольку абсолютное значение тестовой статистики не превышает двустороннее критическое значение, средние значения двух совокупностей статистически не различаются.
- Кроме того, двустороннее значение p теста составляет 0,14, что превышает 0,05 и подтверждает, что средние значения двух популяций статистически не различаются.
t-критерий Уэлча с использованием R
Следующий код иллюстрирует, как выполнить t-критерий Уэлча для наших двух выборок с использованием языка статистического программирования R :
#create two vectors to hold sample data values sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25) sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34) #conduct Welch's test t.test( sample1, sample2) # Welch Two Sample t-test # #data: sample1 and sample2 #t = -1.5379, df = 18.137, p-value = 0.1413 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: #-10.453875 1.614714 #sample estimates: #mean of x mean of y #19.27273 23.69231 #
Функция t.test() отображает следующий соответствующий вывод:
- t: статистика теста = -1,5379
- df : степени свободы = 18,137
- Значение p: значение p двустороннего теста = 0,1413.
- 95% доверительный интервал : 95% доверительный интервал для истинной разницы в популяционных средних = (-10,45, 1,61).
Результаты этого теста соответствуют результатам, полученным вручную и с использованием Excel: разница средних значений для этих двух популяций не является статистически значимой на уровне альфа = 0,05.