วิธีทดสอบ multicollinearity ใน spss
ความหลากหลาย ในการวิเคราะห์การถดถอยเกิดขึ้นเมื่อตัวแปรทำนายตั้งแต่สองตัวขึ้นไปมีความสัมพันธ์กันอย่างมาก โดยไม่ได้ให้ข้อมูลที่ไม่ซ้ำกันหรือเป็นอิสระในแบบจำลองการถดถอย หากระดับความสัมพันธ์ระหว่างตัวแปรสูงเพียงพอ อาจทำให้เกิดปัญหาเมื่อปรับให้เหมาะสมและตีความแบบจำลองการถดถอย
วิธีหนึ่งในการตรวจสอบความเป็นหลายคอลลิเนียร์คือการใช้หน่วยเมตริกที่เรียกว่า ปัจจัยอัตราเงินเฟ้อแปรปรวน (VIF) ซึ่งวัดความสัมพันธ์และความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรทำนายในแบบจำลองการถดถอย
บทช่วยสอนนี้จะอธิบายวิธีใช้ VIF เพื่อตรวจจับ multicollinearity ในการวิเคราะห์การถดถอยใน SPSS
ตัวอย่าง: multicollinearity ใน SPSS
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งแสดงคะแนนสอบของนักเรียน 10 คน พร้อมด้วยจำนวนชั่วโมงที่พวกเขาใช้เวลาเรียน จำนวนข้อสอบฝึกหัดที่สอบ และเกรดปัจจุบันในหลักสูตร:
เราต้องการดำเนินการการถดถอยเชิงเส้นโดยใช้ คะแนน เป็นตัวแปรตอบสนองและ ชั่วโมง prep_exams และ current_grade เป็นตัวแปรทำนาย แต่เราต้องการให้แน่ใจว่าตัวแปรทำนายทั้งสามนั้นไม่มีความสัมพันธ์กันสูง
เพื่อพิจารณาว่าปัญหาหลายเส้นตรงเป็นปัญหาหรือไม่ เราสามารถสร้างค่า VIF สำหรับตัวแปรทำนายแต่ละตัวได้
โดยคลิกที่แท็บ วิเคราะห์ จาก นั้นคลิก Regression จากนั้นคลิก Linear :
ในหน้าต่างใหม่ที่ปรากฏขึ้น ให้ลาก คะแนน ลงในกล่องที่มีข้อความว่า ขึ้นอยู่กับ และลากตัวแปรตัวทำนายทั้งสามตัวลงในกล่องที่มีข้อความว่า Independent(s) จากนั้นคลิก สถิติ และตรวจสอบให้แน่ใจว่าได้ทำเครื่องหมายที่ช่องถัดจาก Collinearity Diagnostics จากนั้นคลิก ดำเนินการต่อ จากนั้นคลิก ตกลง
หลังจากที่คุณคลิก ตกลง ตารางต่อไปนี้จะปรากฏขึ้นโดยแสดงค่า VIF สำหรับตัวแปรทำนายแต่ละตัว:
ค่า VIF สำหรับตัวแปรทำนายแต่ละตัวมีดังนี้:
- ชั่วโมง: 1,169
- prep_exams: 1,403
- คะแนนปัจจุบัน: 1.522
ค่า VIF เริ่มต้นที่ 1 และไม่มีขีดจำกัดบน กฎทั่วไปสำหรับการตีความ VIF คือ:
- ค่า 1 บ่งชี้ว่าไม่มีความสัมพันธ์ระหว่างตัวแปรทำนายที่กำหนดกับตัวแปรทำนายอื่นๆ ในแบบจำลอง
- ค่าระหว่าง 1 ถึง 5 บ่งชี้ถึงความสัมพันธ์ระดับปานกลางระหว่างตัวแปรทำนายที่กำหนดกับตัวแปรทำนายอื่นๆ ในแบบจำลอง แต่มักจะไม่รุนแรงพอที่จะต้องได้รับการดูแลเป็นพิเศษ
- ค่าที่มากกว่า 5 บ่งชี้ถึงความสัมพันธ์ที่อาจร้ายแรงระหว่างตัวแปรทำนายที่กำหนดกับตัวแปรทำนายอื่นๆ ในแบบจำลอง ในกรณีนี้การประมาณค่าสัมประสิทธิ์และค่า p ในผลลัพธ์การถดถอยมีแนวโน้มว่าจะไม่น่าเชื่อถือ
เราจะเห็นได้ว่าไม่มีค่า VIF ใดสำหรับตัวแปรทำนายในตัวอย่างนี้มากกว่า 5 ซึ่งบ่งชี้ว่า multicollinearity จะไม่เป็นปัญหาในแบบจำลองการถดถอย