Як виконати t-тест велча в stata
Найпоширенішим способом порівняння середніх значень між двома незалежними групами є використання двовибіркового t-критерію . Однак цей тест передбачає, що дисперсії між двома групами рівні.
Якщо ви вважаєте, що дисперсія між двома групами неоднакова , ви можете використати t-критерій Велча , який є непараметричним еквівалентом двовибіркового t-критерію.
Цей підручник пояснює, як виконати t-тест Велча в Stata.
Приклад: t-критерій Велча в Stata
Для цього прикладу ми використаємо набір даних Fuel3 , який містить милі на галлон для 12 автомобілів, які пройшли певну обробку палива, і 12 автомобілів, які не отримали.
Виконайте наступні кроки, щоб виконати Т-тест Велча, щоб визначити, чи є різниця в середньому милі на галон між двома групами.
Крок 1: Завантажте та відобразіть дані.
Спочатку завантажте набір даних, ввівши таку команду в поле команд:
використовуйте https://www.stata-press.com/data/r13/fuel3
Перегляньте необроблені дані за допомогою такої команди:
список
Крок 2: Візуалізуйте дані.
Перш ніж виконувати t-тест Уелча, давайте спочатку створимо дві коробкові діаграми , щоб візуалізувати розподіл миль на галон для кожної групи:
миль на галлон графіки, понад (оброблено)
Ми бачимо, що миль на галон групи 1 (група, яка отримала обробку палива) має тенденцію бути вищою, ніж група 0. Ми також бачимо, що дисперсія групи 1 здається трохи меншою, ніж дисперсія групи 0 (ширина коробки менше).
Крок 3: Виконайте t-критерій Велча
Використовуйте такий синтаксис, щоб виконати t-критерій Велча:
ttest variable_to_measure, by (grouping_variable) welch
Ось синтаксис для нашого конкретного прикладу:
ttest mpg, (оброблено) Welch
Ось як інтерпретувати результат:
- Середня миля на галон для групи 0 становила 21 . 95% довірчий інтервал для справжньої середньої популяції становив (19,26525, 22,73745) .
- Середня миля на галон для групи 1 становила 22,75 . 95% довірчий інтервал для справжньої середньої популяції був (20,68449, 24,81551) .
- Середня різниця в милях на галон для групи 0 – групи 1 становила -1,75 . 95% довірчий інтервал для справжньої різниці між середніми сукупністю становив (-4,28369, 0,7836902) .
- Тестовий показник t для t-тесту Велча становив -1,4280 .
- Оскільки нас цікавить альтернативна гіпотеза про те, що середня миля на галон просто відрізнялася між двома групами, ми розглянемо p-значення, пов’язане з Ha:diff != 0, яке виявиться рівним 0,1666 . Оскільки це значення не менше 0,05, ми не маємо достатніх доказів того, що середня миля на галон між двома групами різна.
Крок 4: Повідомте про результати.
Нарешті, ми хотіли б повідомити про результати нашого t-тесту Велча. Ось приклад того, як це зробити:
Т-критерій Велча був виконаний, щоб визначити, чи була статистично значуща різниця в милях на галлон між групою автомобілів, які отримали обробку палива, і групою, яка не обробила паливо. Розмір вибірки для обох груп становив 12 автомобілів.
Т-критерій Велча показав, що не було статистично значущої різниці в середніх значеннях (t = -1,4280, p = 0,1666) між двома групами.
Було встановлено, що 95% довірчий інтервал для справжньої середньої різниці між групою 0 (група без лікування) і групою 1 (група лікування) становив (-4,28369, 0,7836902).