Как выполнить квадратичную регрессию в stata


Когда две переменные имеют линейную связь, вы часто можете использовать простую линейную регрессию для количественной оценки их связи.

Пример линейной зависимости

Однако, когда две переменные имеют квадратичную связь, вы можете использовать квадратичную регрессию для количественной оценки их связи.

Пример квадратичной зависимости

В этом руководстве объясняется, как выполнить квадратичную регрессию в Stata.

Пример: квадратичная регрессия в Stata

Предположим, мы хотим понять взаимосвязь между количеством отработанных часов и счастьем. У нас есть следующие данные о количестве отработанных часов в неделю и уровне счастья (по шкале от 0 до 100) для 16 разных людей:

Набор данных квадратичной регрессии в Stata

Вы можете воспроизвести этот пример, введя именно эти данные в Stata, используя Данные > Редактор данных > Редактор данных (Редактировать) в верхнем меню.

Используйте следующие шаги, чтобы выполнить квадратичную регрессию в Stata.

Шаг 1: Визуализируйте данные.

Прежде чем мы сможем использовать квадратичную регрессию, мы должны убедиться, что связь между объясняющей переменной (часы) и переменной ответа (счастье) действительно квадратичная. Итак, давайте визуализируем данные с помощью диаграммы рассеяния , введя следующее в поле «Команда»:

разогнать часы счастья

В результате получается следующая диаграмма рассеяния:

Квадратичная диаграмма рассеяния в Stata

Мы видим, что счастье имеет тенденцию увеличиваться по мере того, как количество отработанных часов увеличивается от нуля до определенной точки, но затем начинает снижаться, когда количество отработанных часов превышает примерно 30.

Эта перевернутая буква «U» на диаграмме рассеяния указывает на то, что существует квадратичная зависимость между отработанными часами и счастьем, а это означает, что нам следует использовать квадратичную регрессию для количественной оценки этой зависимости.

Шаг 2: Выполните квадратичную регрессию.

Прежде чем подогнать модель квадратичной регрессии к данным, нам нужно создать новую переменную для квадратов значений нашей переменной-предиктора часов . Мы можем сделать это, введя следующее в поле «Команда»:

поколение часов2 = часы*часы

Мы можем просмотреть эту новую переменную, выбрав «Данные» > «Редактор данных» > «Редактор данных (обзор)» в верхнем меню.

Квадратичная регрессия в Stata

Мы видим, что часы2 — это просто часы в квадрате. Теперь мы можем выполнить квадратичную регрессию, используя часы и часы2 в качестве объясняющих переменных, а счастье — в качестве переменной отклика. Чтобы выполнить квадратичную регрессию, введите в поле «Команда» следующее:

регресс часы счастья часы2

Вывод квадратичной регрессии в Stata

Вот как интерпретировать наиболее интересные цифры в результате:

Вероятность > F: 0,000. Это значение p для общей регрессии. Поскольку это значение меньше 0,05, это означает, что переменные-предикторы часы и часы 2 вместе взятые имеют статистически значимую связь с переменной ответа счастье .

R в квадрате: 0,9092. Это доля дисперсии переменной отклика, которую можно объяснить объясняющей переменной. В этом примере 90,92% изменений счастья можно объяснить часами 2 .

Уравнение регрессии: мы можем сформировать уравнение регрессии, используя значения коэффициентов, показанные в выходной таблице. В этом случае уравнение будет иметь вид:

прогнозируемое счастье = -30,25287 + 7,173061 (часы) – 0,1069887 ( 2 часа)

Мы можем использовать это уравнение, чтобы найти прогнозируемое счастье человека, учитывая количество часов, которые он работает в неделю.

Например, человек, который работает 60 часов в неделю, должен иметь уровень счастья 14,97:

прогнозируемое счастье = -30,25287 + 7,173061(60) – 0,1069887(60 2 ) = 14,97 .

И наоборот, человек, который работает 30 часов в неделю, должен иметь уровень счастья 88,65:

прогнозируемое счастье = -30,25287 + 7,173061(30) – 0,1069887(30 2 ) = 88,65 .

Шаг 3: Сообщите о результатах.

Наконец, мы хотим сообщить о результатах нашей квадратичной регрессии. Вот пример того, как это сделать:

Квадратичная регрессия была проведена для количественной оценки взаимосвязи между количеством часов, отработанных человеком, и соответствующим ему уровнем счастья (измеряется от 0 до 100). Для анализа была использована выборка из 16 человек.

Результаты показали, что существует статистически значимая связь между объясняющими переменными часы и часы 2 и переменной ответа счастье (F(2, 13) = 65,09, p <0,0001).

Вместе эти две объясняющие переменные составляют 90,92% объясняемой изменчивости счастья.

Уравнение регрессии оказалось таким:

прогнозируемое счастье = -30,25287 + 7,173061 (часы) – 0,1069887 ( 2 часа)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *