วิธีการตีความค่า aic เชิงลบ


เกณฑ์ข้อมูล Akaike (AIC) เป็นหน่วยเมตริกที่ใช้ในการเปรียบเทียบความพอดีของแบบจำลองการถดถอยต่างๆ

มีการคำนวณดังนี้:

AIC = 2K – 2 ลิตร (L)

ทอง:

  • K: จำนวนพารามิเตอร์โมเดล
  • ln (L) : ความน่าจะเป็นของบันทึกของแบบจำลอง ข้อมูลนี้บอกเราว่าแบบจำลองนี้น่าจะเป็นไปได้เพียงใดเมื่อพิจารณาจากข้อมูล

เมื่อคุณติดตั้งแบบจำลองการถดถอยหลายตัวแล้ว คุณสามารถเปรียบเทียบ ค่า AIC ของแต่ละรุ่นได้ รุ่นที่มี AIC ต่ำที่สุดจะให้ขนาดที่พอดีที่สุด

คำถามที่นักเรียนมักถามเกี่ยวกับ AIC คือ จะตีความค่า AIC เชิงลบได้อย่างไร

คำตอบง่ายๆ: ยิ่งค่า AIC ต่ำ โมเดลก็จะยิ่งพอดี ค่าสัมบูรณ์ของค่า AIC นั้นไม่สำคัญ นี่อาจเป็นค่าบวกหรือลบ

ตัวอย่างเช่น หากโมเดล 1 มีค่า AIC เท่ากับ -56.5 และโมเดล 2 มีค่า AIC เท่ากับ -103.3 แสดงว่าโมเดล 2 จะมีขนาดที่พอดีกว่า ไม่สำคัญว่าค่า AIC ทั้งสองค่าจะเป็นลบหรือไม่

ทำความเข้าใจกับค่า AIC เชิงลบ

เป็นเรื่องง่ายที่จะดูว่าแบบจำลองการถดถอยที่กำหนดอาจส่งผลให้ค่า AIC เป็นลบได้อย่างไร หากเราดูที่สูตรที่ใช้ในการคำนวณ AIC:

AIC = 2K – 2 ลิตร (L)

สมมติว่าเรามีโมเดลที่มีพารามิเตอร์ 7 ตัวและโอกาสที่จะบันทึกเป็น 70

เราจะคำนวณ AIC ของแบบจำลองนี้ดังนี้:

AIC = 2*7 – 2*70 = -126

จากนั้นเราสามารถเปรียบเทียบค่า AIC นี้กับค่าของแบบจำลองการถดถอยอื่นๆ เพื่อพิจารณาว่าแบบจำลองใดเหมาะสมที่สุด

การอ้างอิงตำราเรียนเกี่ยวกับค่า AIC เชิงลบ

การอ้างอิงหนังสือเรียนที่เป็นประโยชน์เกี่ยวกับค่า AIC เชิงลบมาจาก การเลือกแบบจำลองและการอนุมานหลายรูปแบบ: แนวทางข้อมูลเชิงทฤษฎีเชิงปฏิบัติ ในหน้า 62:

โดยปกติแล้ว AIC จะเป็นค่าบวก อย่างไรก็ตามสามารถเลื่อนได้ด้วยค่าคงที่การบวกใด ๆ และการเปลี่ยนแปลงบางอย่างอาจส่งผลให้ค่า AIC เป็นลบ… นี่ไม่ใช่ขนาดสัมบูรณ์ของค่า AIC แต่เป็นค่าสัมพัทธ์ในทุกรุ่นที่พิจารณาและโดยเฉพาะ ความแตกต่างระหว่างค่า AIC ก็เป็นสิ่งสำคัญ

ข้อมูลอ้างอิงที่เป็นประโยชน์อีกประการหนึ่งมาจาก Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences หน้า 402:

เช่นเดียวกับความน่าจะเป็น ค่าสัมบูรณ์ของ AIC ส่วนใหญ่ไม่มีความหมาย (ถูกกำหนดโดยค่าคงที่ที่กำหนดเอง) เนื่องจากค่าคงที่นี้ขึ้นอยู่กับข้อมูล จึงสามารถใช้ AIC เพื่อเปรียบเทียบแบบจำลองที่เหมาะกับตัวอย่างที่เหมือนกันได้

โมเดลที่ดีที่สุดในบรรดาโมเดลที่เป็นไปได้ทั้งหมดที่พิจารณาจึงเป็นโมเดลที่มีค่า AIC น้อยที่สุด (สูญเสียข้อมูลน้อยที่สุดเมื่อเทียบกับโมเดลจริง)

ตามที่ระบุไว้ในหนังสือเรียนทั้งสองเล่ม ค่าสัมบูรณ์ของ AIC นั้นไม่สำคัญ เราเพียงแต่ใช้ค่า AIC เพื่อเปรียบเทียบความพอดีของรุ่น และรุ่นที่มีค่า AIC ต่ำที่สุดจะดีที่สุด

แหล่งข้อมูลเพิ่มเติม

วิธีการคำนวณ AIC ใน R
วิธีการคำนวณ AIC ใน Python

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *