如何在 sas 中执行分位数回归
线性回归是一种我们可以用来理解一个或多个预测变量与响应变量之间关系的方法。
通常,当我们执行线性回归时,我们想要估计响应变量的平均值。
但是,我们可以使用一种称为分位数回归的方法来估计响应值的任何百分位数,例如第 30 个百分位数、第 90 个百分位数、第 98 个百分位数等。
要在 SAS 中执行分位数回归,我们可以使用proc quantreg语句。
以下示例展示了如何在实践中在 SAS 中执行分位数回归。
示例:在 SAS 中运行分位数回归
假设我们在 SAS 中有以下数据集,显示班级学生的学习小时数和相应的考试成绩:
/*create dataset*/
data original_data;
input hours score;
datalines ;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run ;
/*view dataset*/
proc print data = original_data;
接下来,我们将使用学习时间作为预测变量和考试成绩作为响应变量来拟合分位数回归模型。
我们将使用该模型根据学习小时数来预测预期的 90% 考试成绩:
/*perform quantile regression*/ proc quantreg data =original_data; model score = hours / quantile = 0.9 ; run ;
从结果中我们可以看到估计的回归方程:
90% 考试成绩 = 76 + 4.5(小时)
例如,所有学习 2 小时的学生的 90% 分数应为 85:
考试成绩的第 90 个百分位数 = 76 + 4.5*(2) = 85 。
输出还显示原始数据的散点图,并将拟合回归线叠加在图上:
与传统回归模型不同,此回归模型中的拟合线通过预测变量每个值的第 90 个百分位,而不是平均值。
其他资源
以下教程解释了如何在 R 中执行其他常见任务: