วิธีการตีความค่า aic เชิงลบ
เกณฑ์ข้อมูล Akaike (AIC) เป็นหน่วยเมตริกที่ใช้ในการเปรียบเทียบความพอดีของแบบจำลองการถดถอยต่างๆ
มีการคำนวณดังนี้:
AIC = 2K – 2 ลิตร (L)
ทอง:
- K: จำนวนพารามิเตอร์โมเดล
- ln (L) : ความน่าจะเป็นของบันทึกของแบบจำลอง ข้อมูลนี้บอกเราว่าแบบจำลองนี้น่าจะเป็นไปได้เพียงใดเมื่อพิจารณาจากข้อมูล
เมื่อคุณติดตั้งแบบจำลองการถดถอยหลายตัวแล้ว คุณสามารถเปรียบเทียบ ค่า AIC ของแต่ละรุ่นได้ รุ่นที่มี AIC ต่ำที่สุดจะให้ขนาดที่พอดีที่สุด
คำถามที่นักเรียนมักถามเกี่ยวกับ AIC คือ จะตีความค่า AIC เชิงลบได้อย่างไร
คำตอบง่ายๆ: ยิ่งค่า AIC ต่ำ โมเดลก็จะยิ่งพอดี ค่าสัมบูรณ์ของค่า AIC นั้นไม่สำคัญ นี่อาจเป็นค่าบวกหรือลบ
ตัวอย่างเช่น หากโมเดล 1 มีค่า AIC เท่ากับ -56.5 และโมเดล 2 มีค่า AIC เท่ากับ -103.3 แสดงว่าโมเดล 2 จะมีขนาดที่พอดีกว่า ไม่สำคัญว่าค่า AIC ทั้งสองค่าจะเป็นลบหรือไม่
ทำความเข้าใจกับค่า AIC เชิงลบ
เป็นเรื่องง่ายที่จะดูว่าแบบจำลองการถดถอยที่กำหนดอาจส่งผลให้ค่า AIC เป็นลบได้อย่างไร หากเราดูที่สูตรที่ใช้ในการคำนวณ AIC:
AIC = 2K – 2 ลิตร (L)
สมมติว่าเรามีโมเดลที่มีพารามิเตอร์ 7 ตัวและโอกาสที่จะบันทึกเป็น 70
เราจะคำนวณ AIC ของแบบจำลองนี้ดังนี้:
AIC = 2*7 – 2*70 = -126
จากนั้นเราสามารถเปรียบเทียบค่า AIC นี้กับค่าของแบบจำลองการถดถอยอื่นๆ เพื่อพิจารณาว่าแบบจำลองใดเหมาะสมที่สุด
การอ้างอิงตำราเรียนเกี่ยวกับค่า AIC เชิงลบ
การอ้างอิงหนังสือเรียนที่เป็นประโยชน์เกี่ยวกับค่า AIC เชิงลบมาจาก การเลือกแบบจำลองและการอนุมานหลายรูปแบบ: แนวทางข้อมูลเชิงทฤษฎีเชิงปฏิบัติ ในหน้า 62:
โดยปกติแล้ว AIC จะเป็นค่าบวก อย่างไรก็ตามสามารถเลื่อนได้ด้วยค่าคงที่การบวกใด ๆ และการเปลี่ยนแปลงบางอย่างอาจส่งผลให้ค่า AIC เป็นลบ… นี่ไม่ใช่ขนาดสัมบูรณ์ของค่า AIC แต่เป็นค่าสัมพัทธ์ในทุกรุ่นที่พิจารณาและโดยเฉพาะ ความแตกต่างระหว่างค่า AIC ก็เป็นสิ่งสำคัญ
ข้อมูลอ้างอิงที่เป็นประโยชน์อีกประการหนึ่งมาจาก Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences หน้า 402:
เช่นเดียวกับความน่าจะเป็น ค่าสัมบูรณ์ของ AIC ส่วนใหญ่ไม่มีความหมาย (ถูกกำหนดโดยค่าคงที่ที่กำหนดเอง) เนื่องจากค่าคงที่นี้ขึ้นอยู่กับข้อมูล จึงสามารถใช้ AIC เพื่อเปรียบเทียบแบบจำลองที่เหมาะกับตัวอย่างที่เหมือนกันได้
โมเดลที่ดีที่สุดในบรรดาโมเดลที่เป็นไปได้ทั้งหมดที่พิจารณาจึงเป็นโมเดลที่มีค่า AIC น้อยที่สุด (สูญเสียข้อมูลน้อยที่สุดเมื่อเทียบกับโมเดลจริง)
ตามที่ระบุไว้ในหนังสือเรียนทั้งสองเล่ม ค่าสัมบูรณ์ของ AIC นั้นไม่สำคัญ เราเพียงแต่ใช้ค่า AIC เพื่อเปรียบเทียบความพอดีของรุ่น และรุ่นที่มีค่า AIC ต่ำที่สุดจะดีที่สุด