Как выполнить квантильную регрессию в stata


Линейная регрессия — это метод, который мы можем использовать, чтобы понять взаимосвязь между одной или несколькими объясняющими переменными и переменной отклика.

Обычно, когда мы выполняем линейную регрессию, мы хотим оценить среднее значение переменной ответа на основе значения объясняющей переменной. Но вместо этого мы могли бы оценить медиану, или процентиль 0,25, или процентиль 0,90, или любой другой процентиль, который мы хотим.

Именно здесь на помощь приходит квантильная регрессия . Подобно обычной линейной регрессии, квантильная регрессия создает уравнение регрессии, которое предсказывает определенное значение (например, медиану, 0,25 процентиля, 0,90 процентиля и т. д.) для переменной отклика на основе значения объясняющей переменной.

В этом руководстве объясняется, как выполнить квантильную регрессию в Stata.

Пример: квантильная регрессия в Stata

В этом примере мы будем использовать встроенный набор данных Stata под названием auto . Сначала мы подберем модель линейной регрессии, используя вес в качестве предикторной переменной и миль на галлон в качестве переменной отклика. Это покажет нам средний ожидаемый расход автомобиля на галлон в зависимости от его веса. Далее мы применим модель квантильной регрессии, чтобы спрогнозировать процентиль расхода топлива автомобиля в 0,90 миль на галлон в зависимости от его веса.

Шаг 1: Загрузите и отобразите данные.

Используйте следующую команду для загрузки данных:

автоматическое использование системы

Используйте следующую команду, чтобы получить сводку переменных миль на галлон и веса:

суммировать вес миль на галлон

Автоматическая сводка набора данных в Stata

Шаг 2: Выполните простую линейную регрессию.

Используйте следующую команду, чтобы выполнить простую линейную регрессию, используя вес в качестве объясняющей переменной и миль на галлон в качестве переменной ответа:

регрессировать вес до миль на галлон

Интерпретация результатов регрессии в Stata

Из выходной таблицы мы видим, что предполагаемое уравнение регрессии:

прогнозируемое количество миль на галлон = 39,44028 – 0,0060087*(вес)

Мы можем использовать это уравнение, чтобы найти примерное среднее количество миль на галлон для автомобиля, учитывая его вес. Например, расход автомобиля весом 4000 фунтов оценивается в 15 405 миль на галлон:

прогнозируемое количество миль на галлон = 39,44028 – 0,0060087*(4000) = 15,405

Шаг 3: Выполните квантильную регрессию.

Далее, давайте выполним квантильную регрессию, чтобы получить оценку 90-го процентиля экономии топлива автомобиля в зависимости от его веса.

Используйте команду qreg с квантилем (0,90) , чтобы выполнить эту квантильную регрессию:

вес qreg миль на галлон, квантиль (0,90)

Выходные данные квантильной регрессии в Stata

Из выходной таблицы мы видим, что предполагаемое уравнение регрессии:

Прогнозируемое количество миль на галлон для 90-го процентиля = 47,02632 – 0,0072368*(вес)

Мы можем использовать это уравнение, чтобы найти оценку   миль на галлон для автомобиля 90-го процентиля, учитывая его вес. Например, 90-й процентиль миль на галлон для автомобиля весом 4000 фунтов оценивается в 18 709 миль на галлон:

Прогнозируемый 90-й процентиль миль на галлон = 47,02632 – 0,0072368 * (4000) = 18,079

Напомним, что наша предыдущая модель линейной регрессии говорила нам, что автомобиль весом 4000 фунтов имеет расчетную среднюю экономию топлива 15 405 миль на галлон. Таким образом, вполне логично, что эта модель квантильной регрессии говорит нам, что автомобиль весом 4000 фунтов должен будет расходовать 18 079 миль на галлон, чтобы попасть в 90-й процентиль всех автомобилей с таким конкретным весом.

Множественные квантильные регрессии одновременно в Stata

В Stata также можно одновременно выполнить несколько квантильных регрессий. Например, предположим, что мы хотим одновременно оценить 25-й процентиль, медиану (например, 50-й процентиль) и 90-й процентиль.

Для этого мы можем использовать команду sqreg с командой q() , чтобы указать квантили для оценки:

вес, миль на галлон sqreg, q (0,25, 0,50, 0,90)

Выходные данные множественной квантильной регрессии в Stata

Используя этот результат, мы можем построить расчетные уравнения регрессии для каждой квантильной регрессии:

(1) Прогнозируемое количество миль на галлон для 25-го процентиля = 35,22414 – 0,0051724*(вес)

(2) Прогнозируемое количество миль на галлон для 50-го процентиля = 36,94667 – 0,0053333*(вес)

(3) Прогнозируемое количество миль на галлон для 90-го процентиля = 47,02632 – 0,0072368*(вес)

Дополнительные ресурсы

Как выполнить простую линейную регрессию в Stata
Как выполнить множественную линейную регрессию в Stata
Как выполнить квадратичную регрессию в Stata

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *