วิธีการตีความ roc curve (พร้อมตัวอย่าง)


การถดถอยแบบลอจิสติก เป็นวิธีการทางสถิติที่เราใช้เพื่อปรับให้เหมาะสมกับแบบจำลองการถดถอยเมื่อตัวแปรตอบสนองเป็นไบนารี เพื่อประเมินว่าแบบจำลองการถดถอยโลจิสติกเหมาะสมกับชุดข้อมูลได้ดีเพียงใด เราสามารถดูตัวชี้วัดสองตัวต่อไปนี้:

  • ความไว: ความน่าจะเป็นที่แบบจำลองคาดการณ์ผลลัพธ์ที่เป็นบวกสำหรับการสังเกต เมื่อผลลัพธ์เป็นบวกจริงๆ
  • ความจำเพาะ: ความน่าจะเป็นที่แบบจำลองทำนายผลลัพธ์ที่เป็นลบสำหรับการสังเกต เมื่อผลลัพธ์เป็นลบจริงๆ

วิธีง่ายๆ ในการแสดงภาพเมตริกทั้งสองนี้คือการสร้าง เส้นโค้ง ROC ซึ่งเป็นกราฟที่แสดงความไวและความเฉพาะเจาะจงของแบบจำลองการถดถอยลอจิสติก

บทช่วยสอนนี้จะอธิบายวิธีสร้างและตีความเส้นโค้ง ROC

วิธีสร้างเส้นโค้ง ROC

เมื่อเราติดตั้งแบบจำลองการถดถอยลอจิสติกแล้ว เราสามารถใช้แบบจำลองเพื่อจำแนก การสังเกต ออกเป็นสองประเภทได้

ตัวอย่างเช่น เราสามารถจำแนกการสังเกตเป็น “เชิงบวก” หรือ “เชิงลบ”

อัตราบวกที่แท้จริง แสดงถึงสัดส่วนของการสังเกตที่ควรเป็นบวกเมื่อเป็นจริง

ในทางกลับกัน อัตราผลบวกลวง แสดงถึงสัดส่วนของการสังเกตที่ควรเป็นบวก แต่จริงๆ แล้วกลับเป็นลบ

เมื่อเราสร้างเส้นโค้ง ROC เราจะพล็อตคู่ของอัตราบวกจริงกับอัตราบวกลวงสำหรับแต่ละเกณฑ์การตัดสินใจที่เป็นไปได้ของแบบจำลองการถดถอยลอจิสติก

วิธีการตีความเส้นโค้ง ROC

ยิ่งเส้นโค้ง ROC พอดีกับมุมซ้ายบนของพล็อตมากเท่าไร โมเดลก็ยิ่งสามารถจำแนกข้อมูลเป็นหมวดหมู่ได้ดีขึ้นเท่านั้น

ในการหาปริมาณ เราสามารถคำนวณ AUC (พื้นที่ใต้เส้นโค้ง) ซึ่งจะบอกเราว่าพล็อตอยู่ใต้เส้นโค้งมากเพียงใด

ยิ่ง AUC ใกล้ 1 มากเท่าใด โมเดลก็ยิ่งดีเท่านั้น

โมเดลที่มี AUC เท่ากับ 0.5 จะเป็นเส้นทแยงมุมสมบูรณ์ และจะเป็นตัวแทนของโมเดลที่ไม่ดีไปกว่าโมเดลที่ทำการจำแนกประเภทแบบสุ่ม

การคำนวณ AUC สำหรับแบบจำลองการถดถอยโลจิสติกหลายรายการมีประโยชน์อย่างยิ่ง เนื่องจากช่วยให้เราเห็นว่าแบบจำลองใดดีที่สุดในการคาดการณ์

ตัวอย่างเช่น สมมติว่าเราพอดีกับแบบจำลองการถดถอยโลจิสติกที่แตกต่างกันสามแบบ และพล็อตเส้นโค้ง ROC ต่อไปนี้สำหรับแต่ละรุ่น:

สมมติว่าเราคำนวณ AUC สำหรับแต่ละรุ่นดังนี้:

  • รุ่น A: AUC = 0.923
  • รุ่น B: AUC = 0.794
  • รุ่น C: AUC = 0.588

โมเดล A มี AUC สูงสุด ซึ่งบ่งชี้ว่ามีพื้นที่ใต้เส้นโค้งสูงสุด และเป็นแบบจำลองที่ดีที่สุดในการแยกประเภทการสังเกตออกเป็นหมวดหมู่อย่างถูกต้อง

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้อธิบายวิธีสร้างเส้นโค้ง ROC โดยใช้ซอฟต์แวร์ทางสถิติต่างๆ:

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *