Как выполнить t-тест парных выборок в stata
T-критерий парных выборок используется для сравнения средних значений двух выборок, когда каждое наблюдение в одной выборке может быть связано с наблюдением в другой выборке.
В этом руководстве объясняется, как выполнить t-тест для парных выборок в Stata.
Пример: t-критерий для парных выборок в Stata
Исследователи хотят знать, вызывает ли новая обработка топлива изменение среднего расхода топлива на галлон определенного автомобиля. Чтобы проверить это, они проводят эксперимент, в котором измеряют расход топлива 12 автомобилей с обработкой топлива и без нее.
Поскольку каждый автомобиль проходит обработку, мы можем выполнить парный t-тест, в котором каждый автомобиль сопоставляется сам с собой, чтобы определить, существует ли разница в среднем расходе миль на галлон с обработкой топлива и без нее.
Выполните следующие шаги, чтобы выполнить парный t-тест в Stata.
Шаг 1: Загрузите данные.
Сначала загрузите данные, набрав use https://www.stata-press.com/data/r13/fuel в поле команды и нажав Enter.
Шаг 2. Просмотрите необработанные данные.
Прежде чем выполнять парный t-тест, давайте сначала посмотрим на необработанные данные. В верхней строке меню выберите «Данные» > «Редактор данных» > «Редактор данных (Обзор)» . В первом столбце, mpg1 , отображается расход топлива первого автомобиля без обработки топлива, а во втором столбце, mpg2 , отображается расход топлива первого автомобиля с обработкой топлива.
Шаг 3: Выполните парный t-тест.
В верхней строке меню выберите «Статистика» > «Сводки, таблицы и тесты» > «Классические проверки гипотез» > «t-тест» (проверка сравнения средних) .
Выберите «В паре». В качестве первой переменной выберите mpg1 . В качестве второй переменной выберите mpg2 . В разделе «Уровень уверенности» выберите нужный уровень. Значение 95 соответствует уровню значимости 0,05. Мы оставим значение 95. Наконец, нажмите «ОК» .
Будут отображены результаты парного t-теста:
По каждой группе мы получаем следующую информацию:
Obs: Количество наблюдений. В каждой группе по 12 наблюдений.
Среднее: Среднее количество миль на галлон. В группе 0 средний показатель равен 21. В группе 1 средний показатель составляет 22,75.
Стандарт. Err: стандартная ошибка, рассчитываемая как σ / √ n
Стандарт. Dev: стандартное отклонение миль на галлон.
95% Конф. Диапазон: 95% доверительный интервал для истинного среднего показателя по популяции в милях на галлон.
t: тестовая статистика парного t-теста.
степени свободы: степени свободы, используемые для теста, рассчитываются следующим образом: #pairs-1 = 12-1 = 11.
Значения p для трех разных двухвыборочных t-тестов показаны внизу результатов. Поскольку мы хотим понять, отличается ли средний расход миль на галлон между двумя группами, мы посмотрим на результаты промежуточного теста (в котором альтернативной гипотезой является Ha:diff !=0), значение p которого равно 0,0463. .
Поскольку это значение ниже нашего уровня значимости 0,05, мы отвергаем нулевую гипотезу. У нас есть достаточно доказательств, чтобы сказать, что истинное среднее количество миль на галлон в этих двух группах различается.
Шаг 5: Сообщите о результатах.
Наконец, мы сообщим результаты нашего парного t-теста. Вот пример того, как это сделать:
Парный t-тест был проведен на 12 автомобилях, чтобы определить, вызвала ли новая обработка топлива разницу в среднем пробеге на галлон.
Результаты показали, что средний расход миль на галлон был статистически значимым. различались между двумя группами (t = -2,2444 с df = 11, p = 0,0463) при уровне значимости 0,05.
95% доверительный интервал для истинной разницы между средними значениями генеральной совокупности дал интервал (-3,466, -0,034).
Основываясь на этих результатах, новая обработка топлива приводит к статистически значимому увеличению расхода топлива на галлон для автомобилей.