วิธีการคำนวณ rmse ใน sas
วิธีหนึ่งในการประเมินว่าแบบจำลองการถดถอยเหมาะสมกับชุดข้อมูลได้ดีเพียงใดคือการคำนวณ ค่าคลาดเคลื่อนกำลังสองเฉลี่ย ซึ่งเป็นหน่วยเมตริกที่บอกเราถึงระยะห่างเฉลี่ยระหว่างค่าที่คาดการณ์ของแบบจำลองกับค่าจริงของชุดข้อมูล
ยิ่ง RMSE ต่ำเท่าไร โมเดลที่กำหนดก็จะสามารถ “พอดี” ชุดข้อมูลได้ดีขึ้นเท่านั้น
สูตรการหาค่าคลาดเคลื่อนกำลังสองเฉลี่ย ซึ่งมักเรียกสั้น ๆ ว่า RMSE คือ:
RMSE = √ Σ(พี i – O i ) 2 / n
ทอง:
- Σ เป็นสัญลักษณ์ที่แสดงถึง “ผลรวม”
- P i คือค่าที่ทำนายไว้สำหรับการสังเกต ครั้งที่ 3 ในชุดข้อมูล
- O i คือค่าที่สังเกตได้สำหรับการสังเกต ครั้งที่ 3 ในชุดข้อมูล
- n คือขนาดตัวอย่าง
ตัวอย่างทีละขั้นตอนต่อไปนี้แสดงวิธีคำนวณ RMSE สำหรับแบบจำลองการถดถอยเชิงเส้นอย่างง่ายใน SAS
ขั้นตอนที่ 1: สร้างข้อมูล
สำหรับตัวอย่างนี้ เราจะสร้างชุดข้อมูลที่ประกอบด้วยจำนวนชั่วโมงเรียนทั้งหมดและเกรดการสอบปลายภาคของนักเรียน 15 คน
เราจะปรับโมเดลการถดถอยเชิงเส้นอย่างง่ายโดยใช้ ชั่วโมง เป็นตัวแปรทำนายและ ให้คะแนน เป็นตัวแปรตอบสนอง
รหัสต่อไปนี้แสดงวิธีการสร้างชุดข้อมูลนี้ใน SAS:
/*create dataset*/ data exam_data; input hours score; datalines ; 1 64 2 66 4 76 5 73 5 74 6 81 6 83 7 82 8 80 10 88 11 84 11 82 12 91 12 93 14 89 ; run ; /*view dataset*/ proc print data =exam_data;
ขั้นตอนที่ 2: ติดตั้งโมเดลการถดถอยเชิงเส้นอย่างง่าย
ต่อไป เราจะใช้ proc reg เพื่อให้พอดีกับโมเดลการถดถอยเชิงเส้นอย่างง่าย:
/*fit simple linear regression model*/ proc reg data =exam_data; model score = hours; run ;
โปรดทราบว่า RMSE ในเอาต์พุตคือ 3.64093
ขั้นตอนที่ 3: แยก RMSE ออกจากแบบจำลองการถดถอย
หากคุณต้องการแสดง RMSE ของรุ่นนี้เท่านั้นและไม่มีผลลัพธ์เอาต์พุตอื่นๆ คุณสามารถใช้โค้ดต่อไปนี้:
/*fit simple linear regression model*/ proc reg data =exam_data outest =outest noprint ; model score = hours / rmse ; run ; quit ; /*print RMSE of model*/ proc print data =outest; var _RMSE_; run ;
โปรดทราบว่าจะแสดงเฉพาะค่า RMSE 3.64093 ในเอาต์พุต
หมายเหตุ : อาร์กิวเมนต์ noprint ใน proc reg จะบอก SAS ไม่ให้พิมพ์เอาต์พุตผลลัพธ์การถดถอยทั้งหมดเหมือนที่เคยทำในขั้นตอนก่อนหน้า
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:
วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน SAS
วิธีดำเนินการถดถอยเชิงเส้นพหุคูณใน SAS
วิธีดำเนินการถดถอยพหุนามใน SAS
วิธีดำเนินการถดถอยโลจิสติกใน SAS