วิธีการคำนวณ vif ใน excel
ความหลากหลาย ในการวิเคราะห์การถดถอยเกิดขึ้นเมื่อตัวแปรอธิบายตั้งแต่ 2 ตัวแปรขึ้นไปมีความสัมพันธ์กันสูง โดยไม่ได้ให้ข้อมูลที่ไม่ซ้ำกันหรือเป็นอิสระในแบบจำลองการถดถอย หากระดับความสัมพันธ์ระหว่างตัวแปรสูงเพียงพอ อาจทำให้เกิดปัญหาเมื่อปรับให้เหมาะสมและตีความแบบจำลองการถดถอย
โชคดีที่สามารถตรวจสอบความเป็นหลายคอลลิเนียร์ได้โดยใช้หน่วยเมตริกที่เรียกว่า variance inflation factor (VIF) ซึ่งวัดความสัมพันธ์และความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรอธิบายในแบบจำลองการถดถอย
บทช่วยสอนนี้จะอธิบายวิธีคำนวณ VIF ใน Excel
ตัวอย่าง: การคำนวณ VIF ใน Excel
สำหรับตัวอย่างนี้ เราจะทำการถดถอยเชิงเส้นหลายรายการโดยใช้ชุดข้อมูลต่อไปนี้ซึ่งอธิบายคุณสมบัติของผู้เล่นบาสเก็ตบอล 10 คน เราจะปรับโมเดลการถดถอยโดยใช้การให้คะแนนเป็นตัวแปรตอบสนองและคะแนน แอสซิสต์และการรีบาวด์เป็นตัวแปรอธิบาย ต่อไปเราจะระบุค่า VIF สำหรับตัวแปรอธิบายแต่ละตัว
ขั้นตอนที่ 1: ดำเนินการถดถอยเชิงเส้นหลายรายการ
บน Ribbon ด้านบน ให้ไปที่แท็บข้อมูล แล้วคลิกการวิเคราะห์ข้อมูล หากคุณไม่เห็นตัวเลือกนี้ คุณต้อง ติดตั้งซอฟต์แวร์ Analysis ToolPak ฟรี ก่อน
เมื่อคุณคลิกที่การวิเคราะห์ข้อมูล หน้าต่างใหม่จะปรากฏขึ้น เลือก การถดถอย แล้วคลิกตกลง
กรอกตารางที่จำเป็นสำหรับตัวแปรตอบสนองและตัวแปรอธิบาย จากนั้นคลิก ตกลง
สิ่งนี้ให้ผลลัพธ์ดังต่อไปนี้:
ขั้นตอนที่ 2: คำนวณ VIF สำหรับตัวแปรอธิบายแต่ละตัว
ต่อไป เราสามารถคำนวณ VIF สำหรับตัวแปรอธิบายแต่ละตัวในสามตัวแปรโดยดำเนินการถดถอยแต่ละรายการโดยใช้ตัวแปรอธิบายตัวหนึ่งเป็นตัวแปรตอบสนอง และอีกสองตัวเป็นตัวแปรอธิบาย
ตัวอย่างเช่น เราสามารถคำนวณ VIF สำหรับ ตัวแปร คะแนนโดยดำเนินการการถดถอยเชิงเส้นพหุคูณโดยใช้ จุด เป็นตัวแปรตอบสนอง และ ช่วยเหลือ และ รีบาวด์ เป็นตัวแปรอธิบาย
สิ่งนี้ให้ผลลัพธ์ดังต่อไปนี้:
VIF สำหรับ คะแนน จะคำนวณเป็น 1 / (1 – R Square) = 1 / (1 – .433099) = 1.76
จากนั้นเราสามารถทำซ้ำขั้นตอนนี้กับตัวแปรอีกสองตัวคือ แอสซิสต์ และ รีบาวด์
ปรากฎว่า VIF สำหรับตัวแปรอธิบายทั้งสามมีดังนี้:
คะแนน: 1.76
แอสซิสต์: 1.96
รีบาวน์: 1.18
วิธีการตีความค่า VIF
ค่า VIF เริ่มต้นที่ 1 และไม่มีขีดจำกัดบน กฎทั่วไปสำหรับการตีความ VIF คือ:
- ค่า 1 บ่งชี้ว่าไม่มีความสัมพันธ์ระหว่างตัวแปรอธิบายที่กำหนดกับตัวแปรอธิบายอื่นๆ ในแบบจำลอง
- ค่าระหว่าง 1 ถึง 5 บ่งชี้ถึงความสัมพันธ์ระดับปานกลางระหว่างตัวแปรอธิบายที่กำหนดกับตัวแปรอธิบายอื่นๆ ในแบบจำลอง แต่มักจะไม่รุนแรงพอที่จะต้องได้รับการดูแลเป็นพิเศษ
- ค่าที่มากกว่า 5 บ่งชี้ถึงความสัมพันธ์ที่รุนแรงที่อาจเกิดขึ้นระหว่างตัวแปรอธิบายที่กำหนดกับตัวแปรอธิบายอื่นๆ ในแบบจำลอง ในกรณีนี้การประมาณค่าสัมประสิทธิ์และค่า p ในผลลัพธ์การถดถอยมีแนวโน้มว่าจะไม่น่าเชื่อถือ
เนื่องจากค่า VIF แต่ละค่าของตัวแปรอธิบายในแบบจำลองการถดถอยของเราปิดอยู่ที่ 1 ความเป็นหลายเส้นตรงจึงไม่เป็นปัญหาในตัวอย่างของเรา