แผนภูมิคงเหลือ/เลเวอเรจคืออะไร? (คำจำกัดความ & #038; ตัวอย่าง)


แผนภาพปริมาณคงเหลือเทียบกับการงัดแงะ เป็น แผนภูมิวินิจฉัย ประเภทหนึ่งที่ช่วยให้เราสามารถระบุการสังเกตที่มีอิทธิพลในแบบจำลองการถดถอย

ต่อไปนี้คือลักษณะที่พล็อตประเภทนี้ปรากฏในภาษาโปรแกรมเชิงสถิติ R:

การสังเกตแต่ละครั้งในชุดข้อมูลจะแสดงเป็นจุดเดียวในพล็อต แกน x แสดงการงัดของแต่ละจุด และแกน y แสดงค่าคงเหลือที่เป็นมาตรฐานของแต่ละจุด

เลเวอเรจ หมายถึงขอบเขตที่ค่าสัมประสิทธิ์ของแบบจำลองการถดถอยจะเปลี่ยนไป หากการสังเกตเฉพาะเจาะจงถูกลบออกจากชุดข้อมูล

การสังเกตที่มีเลเวอเรจสูงมีอิทธิพลอย่างมากต่อค่าสัมประสิทธิ์ของแบบจำลองการถดถอย หากเราลบข้อสังเกตเหล่านี้ออกไป ค่าสัมประสิทธิ์แบบจำลองจะเปลี่ยนไปอย่างมาก

ปริมาณคงเหลือที่เป็นมาตรฐาน หมายถึงความแตกต่างที่เป็นมาตรฐานระหว่างค่าที่คาดการณ์ไว้สำหรับการสังเกตและมูลค่าที่แท้จริงของการสังเกต

ควรสังเกตว่าการสังเกตอาจมีค่าสัมบูรณ์สูงสำหรับปริมาณคงเหลือที่เป็นมาตรฐาน แต่ค่าเลเวอเรจต่ำ

วิธีการตีความกราฟที่เหลือเทียบกับเลเวอเรจ

หากจุดบนกราฟนี้อยู่นอกระยะคุก (เส้นประสีแดง) จะถือว่าเป็นการสังเกตที่มีอิทธิพล

โปรดดูกราฟคงเหลือเทียบกับกราฟเลเวอเรจที่แสดงก่อนหน้านี้:

ในตัวอย่างด้านบน เราจะเห็นว่าการสังเกต #10 นั้นใกล้กับขีดจำกัดระยะทางของ Cook มากที่สุด แต่ไม่ได้อยู่นอกเส้นประ ซึ่งหมายความ ว่าไม่มีจุดที่มีอิทธิพล ในแบบจำลองการถดถอยของเรา

อย่างไรก็ตาม สมมติว่าเรามีกราฟคงเหลือ/เลเวอเรจดังต่อไปนี้:

เราจะเห็นว่าข้อสังเกต #1 ที่มุมขวาบนอยู่นอกเส้นประสีแดง นี่แสดงว่า เป็นจุดที่มีอิทธิพล

ซึ่งหมายความว่าหากเราลบการสังเกตนี้ออกจากชุดข้อมูลของเราและติดตั้งแบบจำลองการถดถอยอีกครั้ง ค่าสัมประสิทธิ์แบบจำลองจะเปลี่ยนไปอย่างมาก

วิธีจัดการกับการสังเกตที่มีอิทธิพล

หากคุณสร้างพล็อตของปริมาณคงเหลือเทียบกับการใช้ประโยชน์สำหรับแบบจำลอง และเห็นว่าข้อสังเกตอย่างน้อยหนึ่งรายการถูกระบุว่ามีอิทธิพล คุณสามารถทำสิ่งต่างๆ ได้หลายอย่าง:

1. ตรวจสอบว่าการสังเกตไม่ใช่ข้อผิดพลาด

ก่อนดำเนินการใดๆ คุณควรตรวจสอบก่อนว่าข้อสังเกตที่มีอิทธิพลไม่ได้เป็นผลมาจากข้อผิดพลาดในการป้อนข้อมูลหรือเหตุการณ์แปลกๆ อื่นๆ

2. ลองปรับแบบจำลองการถดถอยอื่นให้เหมาะสม

การสังเกตที่มีอิทธิพลอาจบ่งชี้ว่าแบบจำลองที่คุณระบุไม่พอดีกับข้อมูล ในกรณีนี้ คุณสามารถลองใช้ แบบจำลองการถดถอยพหุนาม หรือแบบจำลองไม่เชิงเส้นได้

3. ลบความคิดเห็นที่มีอิทธิพล

สุดท้ายนี้ คุณอาจตัดสินใจที่จะลบการสังเกตที่มีอิทธิพลออก หากแบบจำลองที่คุณระบุดูเหมือนจะเหมาะสมกับข้อมูล ยกเว้นการสังเกตที่มีอิทธิพลหนึ่งหรือสองครั้ง

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับวิธีการใช้ส่วนที่เหลือเพื่อประเมินความเหมาะสมของแบบจำลองการถดถอย

สารตกค้างในสถิติคืออะไร?
สารตกค้างที่ได้มาตรฐานคืออะไร?
วิธีการตีความแผนการวินิจฉัยใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *