วิธีการตีความ roc curve (พร้อมตัวอย่าง)
การถดถอยแบบลอจิสติก เป็นวิธีการทางสถิติที่เราใช้เพื่อปรับให้เหมาะสมกับแบบจำลองการถดถอยเมื่อตัวแปรตอบสนองเป็นไบนารี เพื่อประเมินว่าแบบจำลองการถดถอยโลจิสติกเหมาะสมกับชุดข้อมูลได้ดีเพียงใด เราสามารถดูตัวชี้วัดสองตัวต่อไปนี้:
- ความไว: ความน่าจะเป็นที่แบบจำลองคาดการณ์ผลลัพธ์ที่เป็นบวกสำหรับการสังเกต เมื่อผลลัพธ์เป็นบวกจริงๆ
- ความจำเพาะ: ความน่าจะเป็นที่แบบจำลองทำนายผลลัพธ์ที่เป็นลบสำหรับการสังเกต เมื่อผลลัพธ์เป็นลบจริงๆ
วิธีง่ายๆ ในการแสดงภาพเมตริกทั้งสองนี้คือการสร้าง เส้นโค้ง ROC ซึ่งเป็นกราฟที่แสดงความไวและความเฉพาะเจาะจงของแบบจำลองการถดถอยลอจิสติก
บทช่วยสอนนี้จะอธิบายวิธีสร้างและตีความเส้นโค้ง ROC
วิธีสร้างเส้นโค้ง ROC
เมื่อเราติดตั้งแบบจำลองการถดถอยลอจิสติกแล้ว เราสามารถใช้แบบจำลองเพื่อจำแนก การสังเกต ออกเป็นสองประเภทได้
ตัวอย่างเช่น เราสามารถจำแนกการสังเกตเป็น “เชิงบวก” หรือ “เชิงลบ”
อัตราบวกที่แท้จริง แสดงถึงสัดส่วนของการสังเกตที่ควรเป็นบวกเมื่อเป็นจริง
ในทางกลับกัน อัตราผลบวกลวง แสดงถึงสัดส่วนของการสังเกตที่ควรเป็นบวก แต่จริงๆ แล้วกลับเป็นลบ
เมื่อเราสร้างเส้นโค้ง ROC เราจะพล็อตคู่ของอัตราบวกจริงกับอัตราบวกลวงสำหรับแต่ละเกณฑ์การตัดสินใจที่เป็นไปได้ของแบบจำลองการถดถอยลอจิสติก
วิธีการตีความเส้นโค้ง ROC
ยิ่งเส้นโค้ง ROC พอดีกับมุมซ้ายบนของพล็อตมากเท่าไร โมเดลก็ยิ่งสามารถจำแนกข้อมูลเป็นหมวดหมู่ได้ดีขึ้นเท่านั้น
ในการหาปริมาณ เราสามารถคำนวณ AUC (พื้นที่ใต้เส้นโค้ง) ซึ่งจะบอกเราว่าพล็อตอยู่ใต้เส้นโค้งมากเพียงใด
ยิ่ง AUC ใกล้ 1 มากเท่าใด โมเดลก็ยิ่งดีเท่านั้น
โมเดลที่มี AUC เท่ากับ 0.5 จะเป็นเส้นทแยงมุมสมบูรณ์ และจะเป็นตัวแทนของโมเดลที่ไม่ดีไปกว่าโมเดลที่ทำการจำแนกประเภทแบบสุ่ม
การคำนวณ AUC สำหรับแบบจำลองการถดถอยโลจิสติกหลายรายการมีประโยชน์อย่างยิ่ง เนื่องจากช่วยให้เราเห็นว่าแบบจำลองใดดีที่สุดในการคาดการณ์
ตัวอย่างเช่น สมมติว่าเราพอดีกับแบบจำลองการถดถอยโลจิสติกที่แตกต่างกันสามแบบ และพล็อตเส้นโค้ง ROC ต่อไปนี้สำหรับแต่ละรุ่น:
สมมติว่าเราคำนวณ AUC สำหรับแต่ละรุ่นดังนี้:
- รุ่น A: AUC = 0.923
- รุ่น B: AUC = 0.794
- รุ่น C: AUC = 0.588
โมเดล A มี AUC สูงสุด ซึ่งบ่งชี้ว่ามีพื้นที่ใต้เส้นโค้งสูงสุด และเป็นแบบจำลองที่ดีที่สุดในการแยกประเภทการสังเกตออกเป็นหมวดหมู่อย่างถูกต้อง
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้อธิบายวิธีสร้างเส้นโค้ง ROC โดยใช้ซอฟต์แวร์ทางสถิติต่างๆ: