Как выполнить квантильную регрессию в sas


Линейная регрессия — это метод, который мы можем использовать, чтобы понять взаимосвязь между одной или несколькими переменными-предикторами и переменной отклика .

Обычно, когда мы выполняем линейную регрессию, мы хотим оценить среднее значение переменной ответа.

Однако вместо этого мы могли бы использовать метод, известный как квантильная регрессия , для оценки любого процентиля значения ответа, например 30-го процентиля, 90-го процентиля, 98-го процентиля и т. д.

Чтобы выполнить квантильную регрессию в SAS, мы можем использовать оператор proc quantreg .

В следующем примере показано, как на практике выполнить квантильную регрессию в SAS.

Пример: запуск квантильной регрессии в SAS

Предположим, у нас есть следующий набор данных в SAS, который показывает количество изученных часов и соответствующий балл на экзамене для учащихся в классе:

 /*create dataset*/
data original_data;
    input hours score;
    datalines ;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run ;

/*view dataset*/
proc print data = original_data;

Далее мы подберем модель квантильной регрессии, используя часы обучения в качестве предикторной переменной и результаты экзаменов в качестве переменной ответа.

Мы будем использовать модель для прогнозирования ожидаемого 90-го процентиля результатов экзамена на основе количества изученных часов:

 /*perform quantile regression*/
proc quantreg data =original_data;
    model score = hours / quantile = 0.9 ;
run ;

квантильная регрессия в SAS

Из результата мы можем увидеть предполагаемое уравнение регрессии:

Оценка экзамена 90-го процентиля = 76 + 4,5 (часов)

Например, 90-й процентиль всех студентов, обучающихся 2 часа, должен составлять 85:

90-й процентиль экзаменационного балла = 76 + 4,5*(2) = 85 .

В выходных данных также отображается диаграмма рассеяния необработанных данных с наложенной на график подобранной линией регрессии:

В отличие от традиционной модели регрессии, подобранная линия в этой модели регрессии проходит через 90-й процентиль каждого значения предикторной переменной вместо среднего значения.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как выполнить квадратичную регрессию в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *