Mse เทียบกับ rmse: คุณควรใช้เมตริกใด
แบบจำลองการถดถอยใช้ในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายหนึ่งตัวขึ้นไปกับ ตัวแปรตอบสนอง
เมื่อใดก็ตามที่เราพอดีกับโมเดลการถดถอย เราต้องการเข้าใจว่าโมเดลสามารถใช้ค่าของตัวแปรทำนายเพื่อทำนายค่าของตัวแปรตอบสนองได้ดีเพียงใด
ตัวชี้วัดสองตัวที่เรามักใช้ในการวัดปริมาณว่าแบบจำลองเหมาะสมกับชุดข้อมูลได้ดีเพียงใด ได้แก่ ค่าคลาดเคลื่อนกำลังสองเฉลี่ย (MSE) และค่าคลาดเคลื่อนกำลังสองเฉลี่ยราก (RMSE) ซึ่งคำนวณได้ดังนี้:
MSE : ตัวชี้วัดที่บอกเราถึงความแตกต่างของค่าเฉลี่ยกำลังสองระหว่างค่าที่คาดการณ์กับค่าจริงในชุดข้อมูล ยิ่ง MSE ต่ำ โมเดลก็ยิ่งเหมาะกับชุดข้อมูลมากขึ้นเท่านั้น
MSE = Σ(ŷ ผม – y ผม ) 2 / n
ทอง:
- Σ เป็นสัญลักษณ์ที่หมายถึง “ผลรวม”
- ŷ i คือค่าที่ทำนายไว้สำหรับการสังเกต ครั้งที่ i
- y คือค่าที่สังเกตได้สำหรับการสังเกต ครั้งที่ 3
- n คือขนาดตัวอย่าง
RMSE : ตัวชี้วัดที่บอกเราถึงรากที่สองของรากที่สองหมายถึงผลต่างกำลังสองระหว่างค่าที่คาดการณ์กับค่าจริงในชุดข้อมูล ยิ่ง RMSE ต่ำ โมเดลก็จะเหมาะกับชุดข้อมูลมากขึ้นเท่านั้น
มีการคำนวณดังนี้:
RMSE = √ Σ(ŷ ผม – y ผม ) 2 / n
ทอง:
- Σ เป็นสัญลักษณ์ที่หมายถึง “ผลรวม”
- ŷ i คือค่าที่ทำนายไว้สำหรับการสังเกต ครั้งที่ i
- y คือค่าที่สังเกตได้สำหรับการสังเกต ครั้งที่ 3
- n คือขนาดตัวอย่าง
โปรดทราบว่าสูตรเกือบจะเหมือนกัน อันที่จริง ค่าคลาดเคลื่อนกำลังสองเฉลี่ยเป็นเพียงรากที่สองของค่าคลาดเคลื่อนกำลังสองเฉลี่ย
RMSE เทียบกับ MSE: คุณควรใช้เมตริกใด
ในการประเมินว่าโมเดลเหมาะสมกับชุดข้อมูลได้ดีเพียงใด เรามักใช้ RMSE บ่อยกว่า เนื่องจากโมเดลถูกวัดในหน่วยเดียวกับตัวแปรตอบสนอง
ในทางกลับกัน MSE จะวัดเป็นหน่วยตารางของตัวแปรตอบสนอง
เพื่ออธิบายสิ่งนี้ สมมติว่าเราใช้แบบจำลองการถดถอยเพื่อทำนายว่าผู้เล่น 10 คนจะทำคะแนนได้ในเกมบาสเก็ตบอลกี่คะแนน
ตารางต่อไปนี้แสดงคะแนนที่แบบจำลองทำนายไว้เปรียบเทียบกับคะแนนจริงที่ผู้เล่นทำได้:
เราจะคำนวณค่าคลาดเคลื่อนกำลังสองเฉลี่ย (MSE) ดังนี้
- MSE = Σ(ŷ ผม – y ผม ) 2 / n
- MSE = ((14-12) 2 +(15-15) 2 +(18-20) 2 +(19-16) 2 +(25-20) 2 +(18-19) 2 +(12-16) 2 +(12-20) 2 +(15-16) 2 +(22-16) 2 ) / 10
- มสธ. = 16
ข้อผิดพลาดกำลังสองเฉลี่ยรากคือ 16 นี่บอกเราว่าผลต่างกำลังสองเฉลี่ยรากระหว่างค่าที่คาดการณ์โดยแบบจำลองและค่าจริงคือ 16
ค่าคลาดเคลื่อนกำลังสองค่าเฉลี่ยราก (RMSE) จะเป็นค่ารากที่สองของ MSE:
- ADE = √ EQM
- RMSE = √ 16
- RMSE = 4
ค่าคลาดเคลื่อนกำลังสองเฉลี่ยคือ 4 ซึ่งบอกเราว่าค่าเบี่ยงเบนเฉลี่ยระหว่างคะแนนที่คาดการณ์ไว้กับคะแนนจริงที่ได้คือ 4
โปรดทราบว่าการตีความค่าคลาดเคลื่อนกำลังสองเฉลี่ยนั้นง่ายกว่าค่าคลาดเคลื่อนกำลังสองเฉลี่ย เนื่องจากเรากำลังพูดถึง “คะแนนที่ได้” ซึ่งตรงข้ามกับ “คะแนนที่ได้กำลังสอง”
วิธีใช้ RMSE ในทางปฏิบัติ
ในทางปฏิบัติ โดยทั่วไปแล้ว เราจะใส่โมเดลการถดถอยหลายตัวเข้ากับชุดข้อมูล และคำนวณค่าความผิดพลาดรูทเฉลี่ยกำลังสอง (RMSE) ของแต่ละโมเดล
จากนั้นเราเลือกโมเดลที่มีค่า RMSE ต่ำสุดเป็นโมเดลที่ “ดีที่สุด” เนื่องจากเป็นโมเดลที่ทำให้การคาดการณ์ใกล้เคียงกับค่าจริงในชุดข้อมูลมากที่สุด
โปรดทราบว่าเราสามารถเปรียบเทียบค่า MSE ของแต่ละรุ่นได้ แต่ RMSE นั้นตีความได้ง่ายกว่าและดังนั้นจึงใช้บ่อยกว่า
แหล่งข้อมูลเพิ่มเติม
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
RMSE กับ R-Squared: คุณควรใช้เมตริกใด
เครื่องคิดเลข RMSE