ความแม่นยำที่สมดุลคืออะไร? (คำจำกัดความ & #038; ตัวอย่าง)


ความแม่นยำที่สมดุล เป็นตัวชี้วัดที่เราสามารถใช้เพื่อประเมินประสิทธิภาพของ แบบจำลองการจำแนกประเภท

มีการคำนวณดังนี้:

ความแม่นยำที่สมดุล = (ความไว + ความเฉพาะเจาะจง) / 2

ทอง:

  • ความไว : “อัตราบวกที่แท้จริง” – เปอร์เซ็นต์ของกรณีและปัญหาเชิงบวกที่แบบจำลองสามารถตรวจจับได้
  • ความจำเพาะ : “อัตราเชิงลบที่แท้จริง” – เปอร์เซ็นต์ของกรณีและปัญหาเชิงลบที่แบบจำลองสามารถตรวจพบได้

หน่วยวัดนี้มีประโยชน์อย่างยิ่งเมื่อทั้งสองคลาสไม่สมดุล กล่าวคือ คลาสหนึ่งปรากฏมากกว่าคลาสอื่นมาก

ตัวอย่างต่อไปนี้แสดงวิธีคำนวณความแม่นยำที่สมดุลในทางปฏิบัติ และแสดงให้เห็นว่าเหตุใดจึงเป็นหน่วยวัดที่มีประโยชน์

ตัวอย่าง: การคำนวณความแม่นยำที่สมดุล

สมมติว่านักวิเคราะห์กีฬาใช้ แบบจำลองการถดถอยลอจิสติกส์ เพื่อคาดการณ์ว่าผู้เล่นบาสเกตบอลระดับวิทยาลัยกว่า 400 คนจะถูกคัดเลือกเข้าสู่ NBA หรือไม่

เมทริกซ์ความสับสนต่อไปนี้สรุปการคาดการณ์ที่ทำโดยโมเดล:

ในการคำนวณความแม่นยำที่สมดุลของแบบจำลอง เราจะคำนวณความไวและความจำเพาะก่อน:

  • ความไว : “อัตราบวกที่แท้จริง” = 15 / (15 + 5) = 0.75
  • ความจำเพาะ : “อัตราติดลบที่แท้จริง” = 375 / (375 + 5) = 0.9868

จากนั้นเราสามารถคำนวณความแม่นยำที่สมดุลได้ดังนี้:

  • ความแม่นยำที่สมดุล = (ความไว + ความเฉพาะเจาะจง) / 2
  • ความแม่นยำที่สมดุล = (0.75 + 9868) / 2
  • ความแม่นยำที่สมดุล = 0.8684

ความแม่นยำที่สมดุลของแบบจำลองกลายเป็น 0.8684 .

โปรดทราบว่ายิ่งความแม่นยำสมดุลเข้าใกล้ 1 มากเท่าไร โมเดลก็ยิ่งสามารถจำแนกประเภทการสังเกตได้อย่างถูกต้องมากขึ้นเท่านั้น

ในตัวอย่างนี้ ความแม่นยำที่สมดุลค่อนข้างสูง ซึ่งบอกเราว่าแบบจำลองการถดถอยโลจิสติกทำงานได้ดีมากในการทำนายว่าผู้เล่นระดับวิทยาลัยจะถูกร่างเข้าสู่ NBA หรือไม่

ในสถานการณ์นี้ เนื่องจากคลาสไม่สมดุลมาก (ผู้เล่น 20 คนถูกดราฟท์ และผู้เล่น 380 คนไม่ได้ร่าง) ความแม่นยำที่สมดุลทำให้เราเห็นภาพประสิทธิภาพของโมเดลที่สมจริงมากขึ้น เมื่อเปรียบเทียบกับการวัดความแม่นยำโดยรวม

ตัวอย่างเช่น เราจะคำนวณความแม่นยำของโมเดลดังนี้:

  • ความแม่นยำ = (TP + TN) / (TP + TN + FP + FN)
  • ความแม่นยำ = (15 + 375) / (15 + 375 + 5 + 5)
  • ความแม่นยำ = 0.975

ความแม่นยำของโมเดลคือ 0.975 ซึ่งถือว่าสูงมาก

อย่างไรก็ตาม ให้พิจารณาแบบจำลองที่คาดการณ์ว่าผู้เล่นทุกคนจะยังไม่ได้ดราฟต์ จะมีความแม่นยำ 380/400 = 0.95 ซึ่งต่ำกว่าความแม่นยำของโมเดลของเราเพียงเล็กน้อยเท่านั้น

คะแนนความแม่นยำที่สมดุลที่ 0.8684 ช่วยให้เรามีความคิดที่ดีขึ้นเกี่ยวกับความสามารถของแบบจำลองในการทำนายทั้งสองคลาส

กล่าวอีกนัยหนึ่ง มันทำให้เรามีความคิดที่ดีขึ้นเกี่ยวกับความสามารถของโมเดลในการคาดเดาว่าผู้เล่นคนไหนจะยังไม่ได้ร่าง และ ใครจะไป

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีสร้างเมทริกซ์ความสับสนในซอฟต์แวร์ทางสถิติต่างๆ:

วิธีสร้างเมทริกซ์ความสับสนใน Excel
วิธีสร้างเมทริกซ์ความสับสนใน R
วิธีสร้างเมทริกซ์ความสับสนใน Python

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *