วิธีเปรียบเทียบเส้นโค้ง roc สองเส้น (พร้อมตัวอย่าง)

โดย ดร.เบนจามิน แอนเดอร์สัน กรกฎาคม 10, 2023 แนะนำ 0 ความคิดเห็น

วิธีหนึ่งในการแสดงภาพประสิทธิภาพของ แบบจำลองการจำแนกประเภท ในแมชชีนเลิร์นนิงคือการสร้าง เส้นโค้ง ROC ซึ่งย่อมาจากเส้นโค้ง “ลักษณะการทำงานของตัวรับ”

เส้นโค้งประเภทนี้แสดง ความไว และ ความเฉพาะเจาะจง ของแบบจำลองการจัดหมวดหมู่:

ความไว: ความน่าจะเป็นที่แบบจำลองคาดการณ์ผลลัพธ์ที่เป็นบวกสำหรับการสังเกต เมื่อผลลัพธ์เป็นบวกจริงๆ
ความจำเพาะ: ความน่าจะเป็นที่แบบจำลองทำนายผลลัพธ์ที่เป็นลบสำหรับการสังเกต เมื่อผลลัพธ์เป็นลบจริงๆ

แกน x ของเส้นโค้ง ROC แสดงถึง (1- ความจำเพาะ) และ แกน y แสดงถึง ความไว :

ยิ่งเส้นโค้ง ROC พอดีกับมุมซ้ายบนของพล็อตมากเท่าไร โมเดลก็ยิ่งสามารถจำแนกข้อมูลเป็นหมวดหมู่ได้ดีขึ้นเท่านั้น

ในการหาปริมาณ เราสามารถคำนวณ AUC (พื้นที่ใต้เส้นโค้ง) ซึ่งจะบอกเราว่าพล็อตอยู่ใต้เส้นโค้งมากเพียงใด

ยิ่ง AUC ใกล้ 1 มากเท่าใด โมเดลก็ยิ่งดีเท่านั้น

เมื่อเปรียบเทียบเส้นโค้ง ROC สองเส้นเพื่อพิจารณาว่าโมเดลการจำแนกประเภทใดดีกว่า เรามักจะดูว่าเส้นโค้ง ROC ใด “กอด” ใกล้กับมุมซ้ายบนของโครงเรื่องมากกว่า ดังนั้นจึงมีค่า AUC ที่สูงกว่า

ตัวอย่าง: วิธีเปรียบเทียบเส้นโค้ง ROC สองเส้น

สมมติว่าเราปรับแบบจำลองการถดถอยโลจิสติกและแบบจำลองการไล่ระดับสีเข้ากับชุดข้อมูลเพื่อทำนายผลลัพธ์ของตัวแปรตอบสนอง

สมมติว่าเราสร้างเส้นโค้ง ROC เพื่อให้เห็นภาพประสิทธิภาพของแต่ละรุ่น:

เปรียบเทียบเส้นโค้ง ROC สองเส้น

เส้นสีน้ำเงินแสดงเส้นโค้ง ROC สำหรับแบบจำลองการถดถอยโลจิสติก และเส้นสีส้มแสดงเส้นโค้ง ROC สำหรับแบบจำลองที่เน้นการไล่ระดับสี

จากแผนภูมิของเรา เราจะเห็นค่า AUC ต่อไปนี้สำหรับแต่ละรุ่น:

AUC ของแบบจำลองการถดถอยโลจิสติก: 0.7902
AUC ของแบบจำลองที่เสริมด้วยเกรเดียนต์: 0.9712

เนื่องจากแบบจำลองที่ปรับปรุงการไล่ระดับสีมีค่า AUC ที่สูงกว่า เราจึงบอกว่าแบบจำลองนี้ทำนายผลลัพธ์ของตัวแปรตอบสนองได้ดีขึ้น

หมายเหตุ : ในตัวอย่างนี้ เราเปรียบเทียบเส้นโค้ง ROC เพียงสองเส้นเท่านั้น แต่เป็นไปได้ที่จะปรับแบบจำลองการจำแนกประเภทที่แตกต่างกันหลายแบบให้พอดีกับชุดข้อมูล และเปรียบเทียบเส้นโค้ง ROC ได้มากขึ้นเพื่อกำหนดแบบจำลองที่ดีที่สุดที่จะใช้

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับแบบจำลองการจำแนกประเภทและเส้นโค้ง ROC:

รู้เบื้องต้นเกี่ยวกับการถดถอยโลจิสติก
วิธีการตีความเส้นโค้ง ROC
คะแนน AUC ที่ดีคืออะไร?

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

สวัสดี ฉันชื่อเบนจามิน ศาสตราจารย์สถิติเกษียณอายุแล้ว และผันตัวมาเป็นครูสอนสถิติโดยเฉพาะ ด้วยประสบการณ์และความเชี่ยวชาญที่กว้างขวางในสาขาสถิติ ฉันกระตือรือร้นที่จะแบ่งปันความรู้ของฉันเพื่อเสริมศักยภาพนักเรียนผ่าน Statorials. รู้เพิ่มเติม

ตัวอย่าง: วิธีเปรียบเทียบเส้นโค้ง ROC สองเส้น

แหล่งข้อมูลเพิ่มเติม

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

เพิ่มความคิดเห็น