วิธีดำเนินการถดถอยเชิงปริมาณใน sas


การถดถอยเชิงเส้นเป็นวิธีการที่เราสามารถใช้เพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรทำนายตั้งแต่หนึ่งตัวขึ้นไปกับ ตัวแปรตอบสนอง

โดยทั่วไป เมื่อเราทำการถดถอยเชิงเส้น เราต้องการประมาณค่าเฉลี่ยของตัวแปรตอบสนอง

อย่างไรก็ตาม เราสามารถใช้วิธีที่เรียกว่า การถดถอยเชิงควอนไทล์ แทนเพื่อประมาณ ค่า เปอร์เซ็นไทล์ของค่าการตอบสนอง เช่น เปอร์เซ็นไทล์ที่ 30, เปอร์เซ็นไทล์ที่ 90, เปอร์เซ็นไทล์ที่ 98 เป็นต้น

หากต้องการดำเนินการถดถอยเชิงปริมาณใน SAS เราสามารถใช้คำสั่ง proc quantreg ได้

ตัวอย่างต่อไปนี้แสดงวิธีการถดถอยเชิงปริมาณใน SAS ในทางปฏิบัติ

ตัวอย่าง: การรัน Quantile Regression ใน SAS

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ใน SAS ที่แสดงจำนวนชั่วโมงที่เรียนและคะแนนสอบที่เกี่ยวข้องสำหรับนักเรียนในชั้นเรียน:

 /*create dataset*/
data original_data;
    input hours score;
    datalines ;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run ;

/*view dataset*/
proc print data = original_data;

ต่อไป เราจะปรับแบบจำลองการถดถอยเชิงปริมาณโดยใช้ชั่วโมงที่ศึกษาเป็นตัวแปรทำนายและคะแนนการสอบเป็นตัวแปรตอบสนอง

เราจะใช้แบบจำลองเพื่อทำนายคะแนนสอบเปอร์เซ็นไทล์ที่ 90 ที่คาดหวังโดยพิจารณาจากจำนวนชั่วโมงที่เรียน:

 /*perform quantile regression*/
proc quantreg data =original_data;
    model score = hours / quantile = 0.9 ;
run ;

การถดถอยเชิงปริมาณใน SAS

จากผลลัพธ์เราจะเห็นสมการการถดถอยโดยประมาณ:

คะแนนสอบเปอร์เซ็นไทล์ที่ 90 = 76 + 4.5 (ชั่วโมง)

ตัวอย่างเช่น คะแนนเปอร์เซ็นไทล์ที่ 90 ของนักเรียนทุกคนที่เรียน 2 ชั่วโมงควรเป็น 85:

คะแนนสอบเปอร์เซ็นไทล์ที่ 90 = 76 + 4.5*(2) = 85

เอาต์พุตยังแสดงแผนภาพกระจายของข้อมูลดิบโดยมีเส้นการถดถอยที่พอดีซ้อนทับบนโครงเรื่อง:

ต่างจากแบบจำลองการถดถอยแบบดั้งเดิม เส้นพอดีในแบบจำลองการถดถอยนี้จะผ่านเปอร์เซ็นไทล์ที่ 90 ของแต่ละค่าของตัวแปรทำนาย แทนที่จะเป็นค่าเฉลี่ย

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:

วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน R
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน R
วิธีดำเนินการถดถอยกำลังสองใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *