แผนภูมิคงเหลือ/เลเวอเรจคืออะไร? (คำจำกัดความ & #038; ตัวอย่าง)
แผนภาพปริมาณคงเหลือเทียบกับการงัดแงะ เป็น แผนภูมิวินิจฉัย ประเภทหนึ่งที่ช่วยให้เราสามารถระบุการสังเกตที่มีอิทธิพลในแบบจำลองการถดถอย
ต่อไปนี้คือลักษณะที่พล็อตประเภทนี้ปรากฏในภาษาโปรแกรมเชิงสถิติ R:

การสังเกตแต่ละครั้งในชุดข้อมูลจะแสดงเป็นจุดเดียวในพล็อต แกน x แสดงการงัดของแต่ละจุด และแกน y แสดงค่าคงเหลือที่เป็นมาตรฐานของแต่ละจุด
เลเวอเรจ หมายถึงขอบเขตที่ค่าสัมประสิทธิ์ของแบบจำลองการถดถอยจะเปลี่ยนไป หากการสังเกตเฉพาะเจาะจงถูกลบออกจากชุดข้อมูล
การสังเกตที่มีเลเวอเรจสูงมีอิทธิพลอย่างมากต่อค่าสัมประสิทธิ์ของแบบจำลองการถดถอย หากเราลบข้อสังเกตเหล่านี้ออกไป ค่าสัมประสิทธิ์แบบจำลองจะเปลี่ยนไปอย่างมาก
ปริมาณคงเหลือที่เป็นมาตรฐาน หมายถึงความแตกต่างที่เป็นมาตรฐานระหว่างค่าที่คาดการณ์ไว้สำหรับการสังเกตและมูลค่าที่แท้จริงของการสังเกต
ควรสังเกตว่าการสังเกตอาจมีค่าสัมบูรณ์สูงสำหรับปริมาณคงเหลือที่เป็นมาตรฐาน แต่ค่าเลเวอเรจต่ำ
วิธีการตีความกราฟที่เหลือเทียบกับเลเวอเรจ
หากจุดบนกราฟนี้อยู่นอกระยะคุก (เส้นประสีแดง) จะถือว่าเป็นการสังเกตที่มีอิทธิพล
โปรดดูกราฟคงเหลือเทียบกับกราฟเลเวอเรจที่แสดงก่อนหน้านี้:

ในตัวอย่างด้านบน เราจะเห็นว่าการสังเกต #10 นั้นใกล้กับขีดจำกัดระยะทางของ Cook มากที่สุด แต่ไม่ได้อยู่นอกเส้นประ ซึ่งหมายความ ว่าไม่มีจุดที่มีอิทธิพล ในแบบจำลองการถดถอยของเรา
อย่างไรก็ตาม สมมติว่าเรามีกราฟคงเหลือ/เลเวอเรจดังต่อไปนี้:

เราจะเห็นว่าข้อสังเกต #1 ที่มุมขวาบนอยู่นอกเส้นประสีแดง นี่แสดงว่า เป็นจุดที่มีอิทธิพล
ซึ่งหมายความว่าหากเราลบการสังเกตนี้ออกจากชุดข้อมูลของเราและติดตั้งแบบจำลองการถดถอยอีกครั้ง ค่าสัมประสิทธิ์แบบจำลองจะเปลี่ยนไปอย่างมาก
วิธีจัดการกับการสังเกตที่มีอิทธิพล
หากคุณสร้างพล็อตของปริมาณคงเหลือเทียบกับการใช้ประโยชน์สำหรับแบบจำลอง และเห็นว่าข้อสังเกตอย่างน้อยหนึ่งรายการถูกระบุว่ามีอิทธิพล คุณสามารถทำสิ่งต่างๆ ได้หลายอย่าง:
1. ตรวจสอบว่าการสังเกตไม่ใช่ข้อผิดพลาด
ก่อนดำเนินการใดๆ คุณควรตรวจสอบก่อนว่าข้อสังเกตที่มีอิทธิพลไม่ได้เป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูลหรือเหตุการณ์แปลกๆ อื่นๆ
2. ลองปรับแบบจำลองการถดถอยอื่นให้เหมาะสม
การสังเกตที่มีอิทธิพลอาจบ่งชี้ว่าแบบจำลองที่คุณระบุไม่พอดีกับข้อมูล ในกรณีนี้ คุณสามารถลองใช้ แบบจำลองการถดถอยพหุนาม หรือแบบจำลองไม่เชิงเส้นได้
3. ลบความคิดเห็นที่มีอิทธิพล
สุดท้ายนี้ คุณอาจตัดสินใจที่จะลบการสังเกตที่มีอิทธิพลออก หากแบบจำลองที่คุณระบุดูเหมือนจะเหมาะสมกับข้อมูล ยกเว้นการสังเกตที่มีอิทธิพลหนึ่งหรือสองครั้ง
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับวิธีการใช้ส่วนที่เหลือเพื่อประเมินความเหมาะสมของแบบจำลองการถดถอย
สารตกค้างในสถิติคืออะไร?
สารตกค้างที่ได้มาตรฐานคืออะไร?
วิธีการตีความแผนการวินิจฉัยใน R