Как выполнить t-критерий уэлча в stata
Самый распространенный способ сравнить средние значения между двумя независимыми группами — использовать двухвыборочный t-критерий . Однако этот тест предполагает, что дисперсии между двумя группами равны.
Если вы считаете, что дисперсия между двумя группами не равна, вы можете использовать t-критерий Уэлча , который является непараметрическим эквивалентом двухвыборочного t-критерия.
В этом руководстве объясняется, как выполнить t-критерий Уэлча в Stata.
Пример: t-критерий Уэлча в Stata
В этом примере мы будем использовать набор данных Fuel3 , который содержит расход миль на галлон для 12 автомобилей, прошедших определенную обработку топливом, и 12 автомобилей, которые этого не сделали.
Выполните следующие шаги, чтобы выполнить Т-тест Уэлча и определить, существует ли разница в среднем расходе миль на галлон между двумя группами.
Шаг 1: Загрузите и отобразите данные.
Сначала загрузите набор данных, введя следующую команду в поле «Команда»:
используйте https://www.stata-press.com/data/r13/fuel3
Просмотрите необработанные данные с помощью следующей команды:
список
Шаг 2: Визуализируйте данные.
Прежде чем выполнять t-критерий Уэлча, давайте сначала создадим две коробчатые диаграммы , чтобы визуализировать распределение миль на галлон для каждой группы:
графический блок миль на галлон, сверх(обработано)
Мы видим, что расход топлива в группе 1 (группа, получившая обработку топливом) имеет тенденцию быть выше, чем в группе 0. Мы также можем видеть, что дисперсия группы 1 кажется немного меньшей, чем у группы 0 (ширина коробка меньше).
Шаг 3. Выполните t-критерий Уэлча.
Используйте следующий синтаксис для выполнения t-критерия Уэлча:
ttestvariable_to_measure, автор (grouping_variable) welch
Вот синтаксис для нашего конкретного примера:
ttest миль на галлон, автор (обработано) Уэлч
Вот как интерпретировать результат:
- Среднее количество миль на галлон для группы 0 составило 21 милю на галлон . 95% доверительный интервал для истинного среднего значения популяции составил (19,26525, 22,73745) .
- Средний показатель миль на галлон для группы 1 составил 22,75 миль на галлон . 95% доверительный интервал для истинного среднего значения популяции составил (20,68449, 24,81551) .
- Средняя разница в расходе миль на галлон для групп 0 и 1 составила -1,75 . 95% доверительный интервал для истинной разницы между средними значениями генеральной совокупности составлял (-4,28369, 0,7836902) .
- Статистика теста t для t-критерия Уэлча составила -1,4280 .
- Поскольку нас интересует альтернативная гипотеза о том, что средний расход миль на галлон просто различался между двумя группами, мы посмотрим на значение p, связанное с Ha:diff != 0, которое оказывается равным 0,1666 . Поскольку это значение не менее 0,05, у нас нет достаточных доказательств, чтобы сказать, что средний расход миль на галлон между двумя группами различен.
Шаг 4: Сообщите о результатах.
Наконец, мы хотели бы сообщить о результатах нашего t-критерия Уэлча. Вот пример того, как это сделать:
Был проведен t-критерий Уэлча, чтобы определить, существует ли статистически значимая разница в расходе миль на галлон между группой автомобилей, получивших обработку топливом, и группой, которая этого не сделала. Размер выборки для обеих групп составил 12 автомобилей.
T-критерий Уэлча показал, что не было статистически значимой разницы в средних значениях (t = -1,4280, p = 0,1666) между двумя группами.
95% доверительный интервал для истинной средней разницы между группой 0 (группа, не получавшая лечения) и группой 1 (группа, получавшая лечение) составил (-4,28369, 0,7836902).