แปลงที่เหลือดีหรือไม่ดีเรียกว่าอะไร?


ในการวิเคราะห์การถดถอย พล็อตส่วนที่เหลือ คือพล็อตประเภทหนึ่งที่แสดงค่าที่พอดีของแบบจำลองการถดถอยบนแกน x และส่วนที่เหลือของแบบจำลองตามแนวแกน y

เมื่อตรวจสอบเค้าโครงที่เหลือด้วยสายตา โดยทั่วไปเราจะมองหาสองสิ่งเพื่อพิจารณาว่าเค้าโครงนั้น “ดี” หรือ “ไม่ดี”:

1. ยอดคงเหลือมีแนวโน้มชัดเจนหรือไม่?

  • ในแปลงซากที่ “ดี” ซากที่เหลือไม่แสดงแนวโน้มที่ชัดเจน
  • ในแผนซากที่ “ไม่ดี” สิ่งตกค้างจะมีรูปแบบบางประเภท เช่น เส้นโค้งหรือคลื่น สิ่งนี้บ่งชี้ว่าแบบจำลองการถดถอยที่เราใช้ไม่ได้ให้ความเหมาะสมกับข้อมูล

2. ปริมาณคงเหลือเพิ่มขึ้นหรือลดลงของความแปรปรวนอย่างเป็นระบบหรือไม่?

  • ในพล็อตส่วนที่เหลือที่ “ดี” ส่วนที่เหลือจะถูกสุ่มกระจัดกระจายรอบศูนย์โดยไม่มีการเพิ่มหรือลดความแปรปรวนอย่างเป็นระบบ
  • ในแผนสารตกค้างที่ “ไม่ดี” ความแปรปรวนของสารตกค้างจะเพิ่มขึ้นหรือลดลงอย่างเป็นระบบ

หากแปลงส่วนที่เหลือได้รับการจัดอันดับ “ดี” หมายความว่าเราสามารถเชื่อถือผลลัพธ์ของแบบจำลองการถดถอยได้ และจะปลอดภัยในการตีความค่าสัมประสิทธิ์ของแบบจำลอง

อย่างไรก็ตาม หากพล็อตส่วนที่เหลือได้รับการจัดอันดับ “แย่” นั่นหมายความว่าผลลัพธ์ของแบบจำลองไม่น่าเชื่อถือ และเราจำเป็นต้องปรับแบบจำลองการถดถอยอื่นให้พอดีกับข้อมูล

ตัวอย่างต่อไปนี้จะอธิบายวิธีตีความแปลงที่ดินที่ “ดี” และ “ไม่ดี” ในทางปฏิบัติ

ตัวอย่างที่ 1: ร่องรอยตกค้าง “ดี”

สมมติว่าเราใส่แบบจำลองการถดถอยและได้แผนภาพที่เหลือดังต่อไปนี้:

ตัวอย่างการวางผังที่เหลือที่ดี

เราสามารถตอบคำถามสองข้อต่อไปนี้เพื่อพิจารณาว่านี่เป็นพล็อตที่เหลือ “ดี” หรือไม่:

1. ยอดคงเหลือมีแนวโน้มชัดเจนหรือไม่?

ไม่ ส่วนที่เหลือจะกระจัดกระจายแบบสุ่มรอบๆ ศูนย์ โดยไม่มีรูปแบบที่ชัดเจน

2. ปริมาณคงเหลือเพิ่มขึ้นหรือลดลงของความแปรปรวนอย่างเป็นระบบหรือไม่?

ไม่ สารตกค้างมีความแปรปรวนค่อนข้างคงที่ (เช่น ระยะห่างระหว่างสารตกค้างและค่าศูนย์) ในแต่ละระดับของค่าที่ติดตั้ง

เนื่องจากเราตอบว่า “ไม่” สำหรับคำถามทั้งสองข้อนี้ เราจะถือว่านี่เป็นแปลงที่เหลือ “ดี”

ดังนั้นเราจึงสามารถเชื่อถือผลลัพธ์ของแบบจำลองการถดถอยและตีความค่าสัมประสิทธิ์แบบจำลองได้อย่างปลอดภัย

ตัวอย่างที่ 2: พล็อตส่วนที่เหลือ “ไม่ดี” พร้อมแบบจำลองที่ชัดเจน

สมมติว่าเราใส่แบบจำลองการถดถอยและได้แผนภาพที่เหลือดังต่อไปนี้:

ตัวอย่างการติดตามสารตกค้างที่ไม่ดีด้วยรูปแบบโค้ง

เราสามารถตอบคำถามสองข้อต่อไปนี้เพื่อพิจารณาว่านี่เป็นพล็อตที่เหลือ “ดี” หรือไม่:

1. ยอดคงเหลือมีแนวโน้มชัดเจนหรือไม่?

ใช่ . สารตกค้างแสดงรูปแบบโค้ง

2. ปริมาณคงเหลือเพิ่มขึ้นหรือลดลงของความแปรปรวนอย่างเป็นระบบหรือไม่?

ใช่ . สารตกค้างจะมีระดับความแปรปรวนต่างกันในระดับต่างๆ ของค่าที่ติดตั้ง

เนื่องจากเราตอบว่า “ใช่” อย่างน้อยหนึ่งคำถาม เราจะถือว่านี่เป็นโครงเรื่องที่ “ไม่ดี”

ซึ่งหมายความว่าแบบจำลองการถดถอยไม่เหมาะกับข้อมูล

โดยเฉพาะอย่างยิ่ง รูปแบบโค้ง ในแผนภาพส่วนที่เหลือบ่งชี้ว่าแบบจำลองการถดถอยเชิงเส้นไม่พอดีกับข้อมูล และแบบจำลองการถดถอยกำลังสองน่าจะทำงานได้ดีกว่า

ตัวอย่างที่ 3: พล็อตที่เหลือ “ไม่ดี” ที่มีความแปรปรวนเพิ่มขึ้น

สมมติว่าเราใส่แบบจำลองการถดถอยและได้แผนภาพที่เหลือดังต่อไปนี้:

ตัวอย่างของแปลงเศษเหลือเสียที่มีสภาพต่างกัน

เราสามารถตอบคำถามสองข้อต่อไปนี้เพื่อพิจารณาว่านี่เป็นพล็อตที่เหลือ “ดี” หรือไม่:

1. ยอดคงเหลือมีแนวโน้มชัดเจนหรือไม่?

ไม่ใช่ ยังไม่มีแนวโน้มปริมาณคงเหลือที่ชัดเจน

2. ปริมาณคงเหลือเพิ่มขึ้นหรือลดลงของความแปรปรวนอย่างเป็นระบบหรือไม่?

ใช่ . ความแปรปรวนของสิ่งตกค้างจะเพิ่มขึ้นเมื่อค่าที่ติดตั้งเพิ่มขึ้น

เนื่องจากเราตอบว่า “ใช่” อย่างน้อยหนึ่งคำถาม เราจะถือว่านี่เป็นโครงเรื่องที่ “ไม่ดี”

ในตัวอย่างนี้ ปริมาณคงเหลือต้องทนทุกข์ทรมานจาก ความต่างกัน ซึ่งหมายถึงความแปรปรวนไม่เท่ากันของปริมาณคงเหลือในระดับต่างๆ ของค่าที่พอดี

ซึ่งหมายความว่าผลลัพธ์ของแบบจำลองการถดถอยอาจไม่น่าเชื่อถือ

ดู บทความนี้ เพื่อเรียนรู้วิธีต่างๆ ในการแก้ปัญหาความต่างกันในแบบจำลองการถดถอย

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีสร้างแปลงที่เหลือโดยใช้ซอฟต์แวร์ทางสถิติต่างๆ:

วิธีสร้างพล็อตที่เหลือใน R
วิธีสร้างพล็อตที่เหลือใน Python
วิธีการสร้างพล็อตที่เหลือใน Excel
วิธีสร้างพล็อตคงเหลือใน SAS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *