Как выполнить простую линейную регрессию в stata
Простая линейная регрессия — это метод, который можно использовать, чтобы понять взаимосвязь между объясняющей переменной x и переменной отклика y.
В этом руководстве объясняется, как выполнить простую линейную регрессию в Stata.
Пример: простая линейная регрессия в Stata
Предположим, мы хотим понять взаимосвязь между весом автомобиля и количеством миль на галлон. Чтобы изучить эту взаимосвязь, мы можем выполнить простую линейную регрессию, используя вес в качестве объясняющей переменной и мили на галлон в качестве переменной отклика.
Выполните следующие шаги в Stata, чтобы выполнить простую линейную регрессию, используя набор данных auto , который содержит данные о 74 различных автомобилях.
Шаг 1: Загрузите данные.
Загрузите данные, введя в поле команды следующее:
используйте https://www.stata-press.com/data/r13/auto
Шаг 2. Получите сводку данных.
Получите быстрое представление о данных, с которыми вы работаете, введя следующее в поле «Команда»:
обобщить
Мы видим, что в наборе данных есть 12 различных переменных, но нас интересуют только две — мили на галлон и вес .
Шаг 3: Визуализируйте данные.
Прежде чем выполнять простую линейную регрессию, давайте сначала создадим диаграмму рассеяния веса в зависимости от миль на галлон, чтобы мы могли визуализировать взаимосвязь между этими двумя переменными и проверить наличие очевидных выбросов. Введите следующую команду в поле «Команда», чтобы создать диаграмму рассеяния:
разброс веса миль на галлон
В результате получается следующая диаграмма рассеяния:
Мы видим, что автомобили с более высоким весом, как правило, проезжают меньше миль на галлон. Чтобы количественно оценить эту связь, мы теперь выполним простую линейную регрессию.
Шаг 4: Выполните простую линейную регрессию.
Введите следующую команду в поле «Команда», чтобы выполнить простую линейную регрессию, используя вес в качестве объясняющей переменной и миль на галлон в качестве переменной ответа.
регрессировать вес до миль на галлон
Вот как интерпретировать наиболее интересные цифры в результате:
R в квадрате: 0,6515. Это доля дисперсии переменной отклика, которую можно объяснить объясняющей переменной. В этом примере 65,15% разницы в расходе миль на галлон можно объяснить весом.
Коэф (вес): -0,006. Это говорит нам о среднем изменении переменной ответа, связанном с увеличением объясняющей переменной на одну единицу. В этом примере увеличение веса на каждый фунт связано со снижением веса в среднем на 0,006 миль на галлон.
Коэффициент (_cons): 39,44028. Это сообщает нам среднее значение переменной ответа, когда объясняющая переменная равна нулю. В этом примере среднее количество миль на галлон составляет 39,44028, когда вес автомобиля равен нулю. На самом деле это не имеет смысла интерпретировать, поскольку вес автомобиля не может быть равен нулю, но число 39,44028 необходимо для формирования уравнения регрессии.
Р>|т| (вес): 0,000. Это значение p, связанное со статистикой теста на вес. В данном случае, поскольку это значение меньше 0,05, можно сделать вывод, что существует статистически значимая связь между весом и расходом миль на галлон.
Уравнение регрессии. Наконец, мы можем сформировать уравнение регрессии, используя значения двух коэффициентов. В этом случае уравнение будет иметь вид:
прогнозируемое количество миль на галлон = 39,44028 – 0,0060087*(вес)
Мы можем использовать это уравнение, чтобы найти ожидаемое количество миль на галлон для автомобиля, учитывая его вес. Например, автомобиль весом 4000 фунтов должен иметь расход 15 405 миль на галлон:
прогнозируемое количество миль на галлон = 39,44028 – 0,0060087*(4000) = 15,405
Шаг 5: Сообщите о результатах.
Наконец, мы хотим сообщить о результатах нашей простой линейной регрессии. Вот пример того, как это сделать:
Линейная регрессия была проведена для количественной оценки взаимосвязи между весом автомобиля и количеством миль на галлон. Для анализа была использована выборка из 74 автомобилей.
Результаты показали, что существует статистически значимая связь между весом и расходом миль на галлон (t = -11,60, p <0,0001) и что вес составляет 65,15% объясненной изменчивости расхода миль на галлон.
Уравнение регрессии оказалось таким:
прогнозируемое количество миль на галлон = 39,44 – 0,006 (вес)
Каждый дополнительный фунт был связан со снижением в среднем на -0,006 мили на галлон.