Mse เทียบกับ rmse: คุณควรใช้เมตริกใด


แบบจำลองการถดถอยใช้ในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรทำนายหนึ่งตัวขึ้นไปกับ ตัวแปรตอบสนอง

เมื่อใดก็ตามที่เราพอดีกับโมเดลการถดถอย เราต้องการเข้าใจว่าโมเดลสามารถใช้ค่าของตัวแปรทำนายเพื่อทำนายค่าของตัวแปรตอบสนองได้ดีเพียงใด

ตัวชี้วัดสองตัวที่เรามักใช้ในการวัดปริมาณว่าแบบจำลองเหมาะสมกับชุดข้อมูลได้ดีเพียงใด ได้แก่ ค่าคลาดเคลื่อนกำลังสองเฉลี่ย (MSE) และค่าคลาดเคลื่อนกำลังสองเฉลี่ยราก (RMSE) ซึ่งคำนวณได้ดังนี้:

MSE : ตัวชี้วัดที่บอกเราถึงความแตกต่างของค่าเฉลี่ยกำลังสองระหว่างค่าที่คาดการณ์กับค่าจริงในชุดข้อมูล ยิ่ง MSE ต่ำ โมเดลก็ยิ่งเหมาะกับชุดข้อมูลมากขึ้นเท่านั้น

MSE = Σ(ŷ ผม – y ผม ) 2 / n

ทอง:

  • Σ เป็นสัญลักษณ์ที่หมายถึง “ผลรวม”
  • ŷ i คือค่าที่ทำนายไว้สำหรับการสังเกต ครั้งที่ i
  • y คือค่าที่สังเกตได้สำหรับการสังเกต ครั้งที่ 3
  • n คือขนาดตัวอย่าง

RMSE : ตัวชี้วัดที่บอกเราถึงรากที่สองของรากที่สองหมายถึงผลต่างกำลังสองระหว่างค่าที่คาดการณ์กับค่าจริงในชุดข้อมูล ยิ่ง RMSE ต่ำ โมเดลก็จะเหมาะกับชุดข้อมูลมากขึ้นเท่านั้น

มีการคำนวณดังนี้:

RMSE = √ Σ(ŷ ผม – y ผม ) 2 / n

ทอง:

  • Σ เป็นสัญลักษณ์ที่หมายถึง “ผลรวม”
  • ŷ i คือค่าที่ทำนายไว้สำหรับการสังเกต ครั้งที่ i
  • y คือค่าที่สังเกตได้สำหรับการสังเกต ครั้งที่ 3
  • n คือขนาดตัวอย่าง

โปรดทราบว่าสูตรเกือบจะเหมือนกัน อันที่จริง ค่าคลาดเคลื่อนกำลังสองเฉลี่ยเป็นเพียงรากที่สองของค่าคลาดเคลื่อนกำลังสองเฉลี่ย

RMSE เทียบกับ MSE: คุณควรใช้เมตริกใด

ในการประเมินว่าโมเดลเหมาะสมกับชุดข้อมูลได้ดีเพียงใด เรามักใช้ RMSE บ่อยกว่า เนื่องจากโมเดลถูกวัดในหน่วยเดียวกับตัวแปรตอบสนอง

ในทางกลับกัน MSE จะวัดเป็นหน่วยตารางของตัวแปรตอบสนอง

เพื่ออธิบายสิ่งนี้ สมมติว่าเราใช้แบบจำลองการถดถอยเพื่อทำนายว่าผู้เล่น 10 คนจะทำคะแนนได้ในเกมบาสเก็ตบอลกี่คะแนน

ตารางต่อไปนี้แสดงคะแนนที่แบบจำลองทำนายไว้เปรียบเทียบกับคะแนนจริงที่ผู้เล่นทำได้:

เราจะคำนวณค่าคลาดเคลื่อนกำลังสองเฉลี่ย (MSE) ดังนี้

  • MSE = Σ(ŷ ผม – y ผม ) 2 / n
  • MSE = ((14-12) 2 +(15-15) 2 +(18-20) 2 +(19-16) 2 +(25-20) 2 +(18-19) 2 +(12-16) 2 +(12-20) 2 +(15-16) 2 +(22-16) 2 ) / 10
  • มสธ. = 16

ข้อผิดพลาดกำลังสองเฉลี่ยรากคือ 16 นี่บอกเราว่าผลต่างกำลังสองเฉลี่ยรากระหว่างค่าที่คาดการณ์โดยแบบจำลองและค่าจริงคือ 16

ค่าคลาดเคลื่อนกำลังสองค่าเฉลี่ยราก (RMSE) จะเป็นค่ารากที่สองของ MSE:

  • ADE = √ EQM
  • RMSE = √ 16
  • RMSE = 4

ค่าคลาดเคลื่อนกำลังสองเฉลี่ยคือ 4 ซึ่งบอกเราว่าค่าเบี่ยงเบนเฉลี่ยระหว่างคะแนนที่คาดการณ์ไว้กับคะแนนจริงที่ได้คือ 4

โปรดทราบว่าการตีความค่าคลาดเคลื่อนกำลังสองเฉลี่ยนั้นง่ายกว่าค่าคลาดเคลื่อนกำลังสองเฉลี่ย เนื่องจากเรากำลังพูดถึง “คะแนนที่ได้” ซึ่งตรงข้ามกับ “คะแนนที่ได้กำลังสอง”

วิธีใช้ RMSE ในทางปฏิบัติ

ในทางปฏิบัติ โดยทั่วไปแล้ว เราจะใส่โมเดลการถดถอยหลายตัวเข้ากับชุดข้อมูล และคำนวณค่าความผิดพลาดรูทเฉลี่ยกำลังสอง (RMSE) ของแต่ละโมเดล

จากนั้นเราเลือกโมเดลที่มีค่า RMSE ต่ำสุดเป็นโมเดลที่ “ดีที่สุด” เนื่องจากเป็นโมเดลที่ทำให้การคาดการณ์ใกล้เคียงกับค่าจริงในชุดข้อมูลมากที่สุด

โปรดทราบว่าเราสามารถเปรียบเทียบค่า MSE ของแต่ละรุ่นได้ แต่ RMSE นั้นตีความได้ง่ายกว่าและดังนั้นจึงใช้บ่อยกว่า

แหล่งข้อมูลเพิ่มเติม

รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
RMSE กับ R-Squared: คุณควรใช้เมตริกใด
เครื่องคิดเลข RMSE

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *