วิธีดำเนินการถดถอยเชิงปริมาณใน sas
การถดถอยเชิงเส้นเป็นวิธีการที่เราสามารถใช้เพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรทำนายตั้งแต่หนึ่งตัวขึ้นไปกับ ตัวแปรตอบสนอง
โดยทั่วไป เมื่อเราทำการถดถอยเชิงเส้น เราต้องการประมาณค่าเฉลี่ยของตัวแปรตอบสนอง
อย่างไรก็ตาม เราสามารถใช้วิธีที่เรียกว่า การถดถอยเชิงควอนไทล์ แทนเพื่อประมาณ ค่า เปอร์เซ็นไทล์ของค่าการตอบสนอง เช่น เปอร์เซ็นไทล์ที่ 30, เปอร์เซ็นไทล์ที่ 90, เปอร์เซ็นไทล์ที่ 98 เป็นต้น
หากต้องการดำเนินการถดถอยเชิงปริมาณใน SAS เราสามารถใช้คำสั่ง proc quantreg ได้
ตัวอย่างต่อไปนี้แสดงวิธีการถดถอยเชิงปริมาณใน SAS ในทางปฏิบัติ
ตัวอย่าง: การรัน Quantile Regression ใน SAS
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ใน SAS ที่แสดงจำนวนชั่วโมงที่เรียนและคะแนนสอบที่เกี่ยวข้องสำหรับนักเรียนในชั้นเรียน:
/*create dataset*/
data original_data;
input hours score;
datalines ;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run ;
/*view dataset*/
proc print data = original_data;
ต่อไป เราจะปรับแบบจำลองการถดถอยเชิงปริมาณโดยใช้ชั่วโมงที่ศึกษาเป็นตัวแปรทำนายและคะแนนการสอบเป็นตัวแปรตอบสนอง
เราจะใช้แบบจำลองเพื่อทำนายคะแนนสอบเปอร์เซ็นไทล์ที่ 90 ที่คาดหวังโดยพิจารณาจากจำนวนชั่วโมงที่เรียน:
/*perform quantile regression*/ proc quantreg data =original_data; model score = hours / quantile = 0.9 ; run ;
จากผลลัพธ์เราจะเห็นสมการการถดถอยโดยประมาณ:
คะแนนสอบเปอร์เซ็นไทล์ที่ 90 = 76 + 4.5 (ชั่วโมง)
ตัวอย่างเช่น คะแนนเปอร์เซ็นไทล์ที่ 90 ของนักเรียนทุกคนที่เรียน 2 ชั่วโมงควรเป็น 85:
คะแนนสอบเปอร์เซ็นไทล์ที่ 90 = 76 + 4.5*(2) = 85
เอาต์พุตยังแสดงแผนภาพกระจายของข้อมูลดิบโดยมีเส้นการถดถอยที่พอดีซ้อนทับบนโครงเรื่อง:
ต่างจากแบบจำลองการถดถอยแบบดั้งเดิม เส้นพอดีในแบบจำลองการถดถอยนี้จะผ่านเปอร์เซ็นไทล์ที่ 90 ของแต่ละค่าของตัวแปรทำนาย แทนที่จะเป็นค่าเฉลี่ย
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีดำเนินการถดถอยกำลังสองใน R