วิธีทดสอบ multicollinearity ใน spss


ความหลากหลาย ในการวิเคราะห์การถดถอยเกิดขึ้นเมื่อตัวแปรทำนายตั้งแต่สองตัวขึ้นไปมีความสัมพันธ์กันอย่างมาก โดยไม่ได้ให้ข้อมูลที่ไม่ซ้ำกันหรือเป็นอิสระในแบบจำลองการถดถอย หากระดับความสัมพันธ์ระหว่างตัวแปรสูงเพียงพอ อาจทำให้เกิดปัญหาเมื่อปรับให้เหมาะสมและตีความแบบจำลองการถดถอย

วิธีหนึ่งในการตรวจสอบความเป็นหลายคอลลิเนียร์คือการใช้หน่วยเมตริกที่เรียกว่า ปัจจัยอัตราเงินเฟ้อแปรปรวน (VIF) ซึ่งวัดความสัมพันธ์และความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรทำนายในแบบจำลองการถดถอย

บทช่วยสอนนี้จะอธิบายวิธีใช้ VIF เพื่อตรวจจับ multicollinearity ในการวิเคราะห์การถดถอยใน SPSS

ตัวอย่าง: multicollinearity ใน SPSS

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งแสดงคะแนนสอบของนักเรียน 10 คน พร้อมด้วยจำนวนชั่วโมงที่พวกเขาใช้เวลาเรียน จำนวนข้อสอบฝึกหัดที่สอบ และเกรดปัจจุบันในหลักสูตร:

เราต้องการดำเนินการการถดถอยเชิงเส้นโดยใช้ คะแนน เป็นตัวแปรตอบสนองและ ชั่วโมง prep_exams และ current_grade เป็นตัวแปรทำนาย แต่เราต้องการให้แน่ใจว่าตัวแปรทำนายทั้งสามนั้นไม่มีความสัมพันธ์กันสูง

เพื่อพิจารณาว่าปัญหาหลายเส้นตรงเป็นปัญหาหรือไม่ เราสามารถสร้างค่า VIF สำหรับตัวแปรทำนายแต่ละตัวได้

โดยคลิกที่แท็บ วิเคราะห์ จาก นั้นคลิก Regression จากนั้นคลิก Linear :

ในหน้าต่างใหม่ที่ปรากฏขึ้น ให้ลาก คะแนน ลงในกล่องที่มีข้อความว่า ขึ้นอยู่กับ และลากตัวแปรตัวทำนายทั้งสามตัวลงในกล่องที่มีข้อความว่า Independent(s) จากนั้นคลิก สถิติ และตรวจสอบให้แน่ใจว่าได้ทำเครื่องหมายที่ช่องถัดจาก Collinearity Diagnostics จากนั้นคลิก ดำเนินการต่อ จากนั้นคลิก ตกลง

หลังจากที่คุณคลิก ตกลง ตารางต่อไปนี้จะปรากฏขึ้นโดยแสดงค่า VIF สำหรับตัวแปรทำนายแต่ละตัว:

VIF ใน SPSS

ค่า VIF สำหรับตัวแปรทำนายแต่ละตัวมีดังนี้:

  • ชั่วโมง: 1,169
  • prep_exams: 1,403
  • คะแนนปัจจุบัน: 1.522

ค่า VIF เริ่มต้นที่ 1 และไม่มีขีดจำกัดบน กฎทั่วไปสำหรับการตีความ VIF คือ:

  • ค่า 1 บ่งชี้ว่าไม่มีความสัมพันธ์ระหว่างตัวแปรทำนายที่กำหนดกับตัวแปรทำนายอื่นๆ ในแบบจำลอง
  • ค่าระหว่าง 1 ถึง 5 บ่งชี้ถึงความสัมพันธ์ระดับปานกลางระหว่างตัวแปรทำนายที่กำหนดกับตัวแปรทำนายอื่นๆ ในแบบจำลอง แต่มักจะไม่รุนแรงพอที่จะต้องได้รับการดูแลเป็นพิเศษ
  • ค่าที่มากกว่า 5 บ่งชี้ถึงความสัมพันธ์ที่อาจร้ายแรงระหว่างตัวแปรทำนายที่กำหนดกับตัวแปรทำนายอื่นๆ ในแบบจำลอง ในกรณีนี้การประมาณค่าสัมประสิทธิ์และค่า p ในผลลัพธ์การถดถอยมีแนวโน้มว่าจะไม่น่าเชื่อถือ

เราจะเห็นได้ว่าไม่มีค่า VIF ใดสำหรับตัวแปรทำนายในตัวอย่างนี้มากกว่า 5 ซึ่งบ่งชี้ว่า multicollinearity จะไม่เป็นปัญหาในแบบจำลองการถดถอย

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *