Як виконати квантильну регресію в stata
Лінійна регресія – це метод, який ми можемо використати для розуміння зв’язку між однією або декількома пояснювальними змінними та змінною відповіді.
Як правило, коли ми виконуємо лінійну регресію, ми хочемо оцінити середнє значення змінної відповіді на основі значення пояснювальної змінної. Але натомість ми можемо оцінити медіану, або 0,25 процентиль, або 0,90 процентиль, або будь-який інший процентиль, який ми хочемо.
Ось тут і з’являється квантильна регресія . Подібно до лінійної звичайної регресії, квантильна регресія створює рівняння регресії, яке передбачає певне значення (наприклад, медіана, 0,25 процентиль, 0,90 процентиль тощо) для змінної відповіді на основі значення пояснювальної змінної.
Цей посібник пояснює, як виконати квантильну регресію в Stata.
Приклад: квантильна регресія в Stata
Для цього прикладу ми використаємо вбудований набір даних Stata під назвою auto . Спочатку ми підіб’ємо лінійну регресійну модель, використовуючи вагу як змінну прогностику та mpg як змінну відповіді. Це вкаже нам середню очікувану кількість миль на галон автомобіля, виходячи з його ваги. Далі ми підіб’ємо модель квантильної регресії, щоб передбачити процентиль автомобіля на 0,90 милі на галлон на основі його ваги.
Крок 1: Завантажте та відобразіть дані.
Використовуйте таку команду, щоб завантажити дані:
автоматичне використання системи
Використовуйте наступну команду, щоб отримати зведення про милі на галон і змінні ваги:
підсумувати вагу миль на галлон
Крок 2. Виконайте просту лінійну регресію.
Використовуйте таку команду, щоб виконати просту лінійну регресію, використовуючи вагу як пояснювальну змінну та mpg як змінну відповіді:
регрес вага до миль на галлон
З вихідної таблиці ми бачимо, що оцінене рівняння регресії таке:
прогнозований миль на галон = 39,44028 – 0,0060087*(вага)
Ми можемо використовувати це рівняння, щоб знайти приблизну середню кількість миль на галон для автомобіля, враховуючи його вагу. Наприклад, автомобіль, який важить 4000 фунтів, за оцінками, має 15 405 миль на галон:
прогнозований миль на галон = 39,44028 – 0,0060087*(4000) = 15,405
Крок 3: Виконайте квантильну регресію.
Далі виконаємо квантильну регресію, щоб отримати приблизно 90- й процентиль економії палива автомобіля на основі його ваги.
Використовуйте команду qreg із квантилем (0,90) , щоб виконати цю квантильну регресію:
вага qreg mpg, квантиль (0,90)
З вихідної таблиці ми бачимо, що оцінене рівняння регресії таке:
Прогнозований 90-й процентиль миль на галон = 47,02632 – 0,0072368*(вага)
Ми можемо використовувати це рівняння, щоб знайти оцінку mpg для автомобіля в 90-му процентилі, враховуючи його вагу. Наприклад, 90-й процентиль миль на галон для автомобіля вагою 4000 фунтів оцінюється в 18 709:
Прогнозований 90-й процентиль миль на галон = 47,02632 – 0,0072368*(4000) = 18,079
Нагадаємо, що наша попередня модель лінійної регресії показала, що автомобіль вагою 4000 фунтів мав середню економію палива 15 405 миль на галлон. Тож має сенс те, що ця модель квантильної регресії говорить нам, що автомобіль вагою 4000 фунтів мав би отримати 18 079 миль на галон, щоб бути в 90-му процентилі всіх автомобілів із такою конкретною вагою.
Кілька квантильних регресій одночасно в Stata
У Stata також можна виконувати кілька квантильних регресій одночасно. Наприклад, припустімо, що ми хочемо одночасно оцінити 25-й процентиль, медіану (наприклад, 50-й процентиль) і 90-й процентиль.
Для цього ми можемо використати команду sqreg із командою q() , щоб вказати квантилі для оцінки:
вага mpg sqreg, q (0,25, 0,50, 0,90)
Використовуючи цей результат, ми можемо побудувати розрахункові рівняння регресії для кожної квантильної регресії:
(1) Прогнозований 25-й процентиль миль на галон = 35,22414 – 0,0051724*(вага)
(2) Прогнозований 50-й процентиль миль на галон = 36,94667 – 0,0053333*(вага)
(3) Прогнозований 90-й процентиль миль на галон = 47,02632 – 0,0072368*(вага)
Додаткові ресурси
Як виконати просту лінійну регресію в Stata
Як виконати множинну лінійну регресію в Stata
Як виконати квадратичну регресію в Stata