Как выполнить квантильную регрессию в sas
Линейная регрессия — это метод, который мы можем использовать, чтобы понять взаимосвязь между одной или несколькими переменными-предикторами и переменной отклика .
Обычно, когда мы выполняем линейную регрессию, мы хотим оценить среднее значение переменной ответа.
Однако вместо этого мы могли бы использовать метод, известный как квантильная регрессия , для оценки любого процентиля значения ответа, например 30-го процентиля, 90-го процентиля, 98-го процентиля и т. д.
Чтобы выполнить квантильную регрессию в SAS, мы можем использовать оператор proc quantreg .
В следующем примере показано, как на практике выполнить квантильную регрессию в SAS.
Пример: запуск квантильной регрессии в SAS
Предположим, у нас есть следующий набор данных в SAS, который показывает количество изученных часов и соответствующий балл на экзамене для учащихся в классе:
/*create dataset*/
data original_data;
input hours score;
datalines ;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run ;
/*view dataset*/
proc print data = original_data;
Далее мы подберем модель квантильной регрессии, используя часы обучения в качестве предикторной переменной и результаты экзаменов в качестве переменной ответа.
Мы будем использовать модель для прогнозирования ожидаемого 90-го процентиля результатов экзамена на основе количества изученных часов:
/*perform quantile regression*/ proc quantreg data =original_data; model score = hours / quantile = 0.9 ; run ;
Из результата мы можем увидеть предполагаемое уравнение регрессии:
Оценка экзамена 90-го процентиля = 76 + 4,5 (часов)
Например, 90-й процентиль всех студентов, обучающихся 2 часа, должен составлять 85:
90-й процентиль экзаменационного балла = 76 + 4,5*(2) = 85 .
В выходных данных также отображается диаграмма рассеяния необработанных данных с наложенной на график подобранной линией регрессии:
В отличие от традиционной модели регрессии, подобранная линия в этой модели регрессии проходит через 90-й процентиль каждого значения предикторной переменной вместо среднего значения.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как выполнить квадратичную регрессию в R