วิธีการคำนวณ vif ใน excel


ความหลากหลาย ในการวิเคราะห์การถดถอยเกิดขึ้นเมื่อตัวแปรอธิบายตั้งแต่ 2 ตัวแปรขึ้นไปมีความสัมพันธ์กันสูง โดยไม่ได้ให้ข้อมูลที่ไม่ซ้ำกันหรือเป็นอิสระในแบบจำลองการถดถอย หากระดับความสัมพันธ์ระหว่างตัวแปรสูงเพียงพอ อาจทำให้เกิดปัญหาเมื่อปรับให้เหมาะสมและตีความแบบจำลองการถดถอย

โชคดีที่สามารถตรวจสอบความเป็นหลายคอลลิเนียร์ได้โดยใช้หน่วยเมตริกที่เรียกว่า variance inflation factor (VIF) ซึ่งวัดความสัมพันธ์และความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรอธิบายในแบบจำลองการถดถอย

บทช่วยสอนนี้จะอธิบายวิธีคำนวณ VIF ใน Excel

ตัวอย่าง: การคำนวณ VIF ใน Excel

สำหรับตัวอย่างนี้ เราจะทำการถดถอยเชิงเส้นหลายรายการโดยใช้ชุดข้อมูลต่อไปนี้ซึ่งอธิบายคุณสมบัติของผู้เล่นบาสเก็ตบอล 10 คน เราจะปรับโมเดลการถดถอยโดยใช้การให้คะแนนเป็นตัวแปรตอบสนองและคะแนน แอสซิสต์และการรีบาวด์เป็นตัวแปรอธิบาย ต่อไปเราจะระบุค่า VIF สำหรับตัวแปรอธิบายแต่ละตัว

ข้อมูลดิบใน Excel

ขั้นตอนที่ 1: ดำเนินการถดถอยเชิงเส้นหลายรายการ

บน Ribbon ด้านบน ให้ไปที่แท็บข้อมูล แล้วคลิกการวิเคราะห์ข้อมูล หากคุณไม่เห็นตัวเลือกนี้ คุณต้อง ติดตั้งซอฟต์แวร์ Analysis ToolPak ฟรี ก่อน

Toolpak การวิเคราะห์ข้อมูลใน Excel

เมื่อคุณคลิกที่การวิเคราะห์ข้อมูล หน้าต่างใหม่จะปรากฏขึ้น เลือก การถดถอย แล้วคลิกตกลง

การถดถอยด้วย Data Analysis Toolpak ใน Excel

กรอกตารางที่จำเป็นสำหรับตัวแปรตอบสนองและตัวแปรอธิบาย จากนั้นคลิก ตกลง

การถดถอยพหุคูณใน Excel

สิ่งนี้ให้ผลลัพธ์ดังต่อไปนี้:

เอาต์พุตการถดถอยใน Excel

ขั้นตอนที่ 2: คำนวณ VIF สำหรับตัวแปรอธิบายแต่ละตัว

ต่อไป เราสามารถคำนวณ VIF สำหรับตัวแปรอธิบายแต่ละตัวในสามตัวแปรโดยดำเนินการถดถอยแต่ละรายการโดยใช้ตัวแปรอธิบายตัวหนึ่งเป็นตัวแปรตอบสนอง และอีกสองตัวเป็นตัวแปรอธิบาย

ตัวอย่างเช่น เราสามารถคำนวณ VIF สำหรับ ตัวแปร คะแนนโดยดำเนินการการถดถอยเชิงเส้นพหุคูณโดยใช้ จุด เป็นตัวแปรตอบสนอง และ ช่วยเหลือ และ รีบาวด์ เป็นตัวแปรอธิบาย

สิ่งนี้ให้ผลลัพธ์ดังต่อไปนี้:

คำนวณ VIF ใน Excel

VIF สำหรับ คะแนน จะคำนวณเป็น 1 / (1 – R Square) = 1 / (1 – .433099) = 1.76

จากนั้นเราสามารถทำซ้ำขั้นตอนนี้กับตัวแปรอีกสองตัวคือ แอสซิสต์ และ รีบาวด์

ปรากฎว่า VIF สำหรับตัวแปรอธิบายทั้งสามมีดังนี้:

คะแนน: 1.76
แอสซิสต์: 1.96
รีบาวน์: 1.18

วิธีการตีความค่า VIF

ค่า VIF เริ่มต้นที่ 1 และไม่มีขีดจำกัดบน กฎทั่วไปสำหรับการตีความ VIF คือ:

  • ค่า 1 บ่งชี้ว่าไม่มีความสัมพันธ์ระหว่างตัวแปรอธิบายที่กำหนดกับตัวแปรอธิบายอื่นๆ ในแบบจำลอง
  • ค่าระหว่าง 1 ถึง 5 บ่งชี้ถึงความสัมพันธ์ระดับปานกลางระหว่างตัวแปรอธิบายที่กำหนดกับตัวแปรอธิบายอื่นๆ ในแบบจำลอง แต่มักจะไม่รุนแรงพอที่จะต้องได้รับการดูแลเป็นพิเศษ
  • ค่าที่มากกว่า 5 บ่งชี้ถึงความสัมพันธ์ที่รุนแรงที่อาจเกิดขึ้นระหว่างตัวแปรอธิบายที่กำหนดกับตัวแปรอธิบายอื่นๆ ในแบบจำลอง ในกรณีนี้การประมาณค่าสัมประสิทธิ์และค่า p ในผลลัพธ์การถดถอยมีแนวโน้มว่าจะไม่น่าเชื่อถือ

เนื่องจากค่า VIF แต่ละค่าของตัวแปรอธิบายในแบบจำลองการถดถอยของเราปิดอยู่ที่ 1 ความเป็นหลายเส้นตรงจึงไม่เป็นปัญหาในตัวอย่างของเรา

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *