Как выполнить t-критерий уэлча в stata


Самый распространенный способ сравнить средние значения между двумя независимыми группами — использовать двухвыборочный t-критерий . Однако этот тест предполагает, что дисперсии между двумя группами равны.

Если вы считаете, что дисперсия между двумя группами не равна, вы можете использовать t-критерий Уэлча , который является непараметрическим эквивалентом двухвыборочного t-критерия.

В этом руководстве объясняется, как выполнить t-критерий Уэлча в Stata.

Пример: t-критерий Уэлча в Stata

В этом примере мы будем использовать набор данных Fuel3 , который содержит расход миль на галлон для 12 автомобилей, прошедших определенную обработку топливом, и 12 автомобилей, которые этого не сделали.

Выполните следующие шаги, чтобы выполнить Т-тест Уэлча и определить, существует ли разница в среднем расходе миль на галлон между двумя группами.

Шаг 1: Загрузите и отобразите данные.

Сначала загрузите набор данных, введя следующую команду в поле «Команда»:

используйте https://www.stata-press.com/data/r13/fuel3

Просмотрите необработанные данные с помощью следующей команды:

список

Пример команды списка в Stata

Шаг 2: Визуализируйте данные.

Прежде чем выполнять t-критерий Уэлча, давайте сначала создадим две коробчатые диаграммы , чтобы визуализировать распределение миль на галлон для каждой группы:

графический блок миль на галлон, сверх(обработано)

Боксплоты в Stata

Мы видим, что расход топлива в группе 1 (группа, получившая обработку топливом) имеет тенденцию быть выше, чем в группе 0. Мы также можем видеть, что дисперсия группы 1 кажется немного меньшей, чем у группы 0 (ширина коробка меньше).

Шаг 3. Выполните t-критерий Уэлча.

Используйте следующий синтаксис для выполнения t-критерия Уэлча:

ttestvariable_to_measure, автор (grouping_variable) welch

Вот синтаксис для нашего конкретного примера:

ttest миль на галлон, автор (обработано) Уэлч

Вывод t-критерия Уэлча в Stata

Вот как интерпретировать результат:

  • Среднее количество миль на галлон для группы 0 составило 21 милю на галлон . 95% доверительный интервал для истинного среднего значения популяции составил (19,26525, 22,73745) .
  • Средний показатель миль на галлон для группы 1 составил 22,75 миль на галлон . 95% доверительный интервал для истинного среднего значения популяции составил (20,68449, 24,81551) .
  • Средняя разница в расходе миль на галлон для групп 0 и 1 составила -1,75 . 95% доверительный интервал для истинной разницы между средними значениями генеральной совокупности составлял (-4,28369, 0,7836902) .
  • Статистика теста t для t-критерия Уэлча составила -1,4280 .
  • Поскольку нас интересует альтернативная гипотеза о том, что средний расход миль на галлон просто различался между двумя группами, мы посмотрим на значение p, связанное с Ha:diff != 0, которое оказывается равным 0,1666 . Поскольку это значение не менее 0,05, у нас нет достаточных доказательств, чтобы сказать, что средний расход миль на галлон между двумя группами различен.

Шаг 4: Сообщите о результатах.

Наконец, мы хотели бы сообщить о результатах нашего t-критерия Уэлча. Вот пример того, как это сделать:

Был проведен t-критерий Уэлча, чтобы определить, существует ли статистически значимая разница в расходе миль на галлон между группой автомобилей, получивших обработку топливом, и группой, которая этого не сделала. Размер выборки для обеих групп составил 12 автомобилей.

T-критерий Уэлча показал, что не было статистически значимой разницы в средних значениях (t = -1,4280, p = 0,1666) между двумя группами.

95% доверительный интервал для истинной средней разницы между группой 0 (группа, не получавшая лечения) и группой 1 (группа, получавшая лечение) составил (-4,28369, 0,7836902).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *