كيفية حساب عامل التضخم التباين (vif) في sas


في تحليل الانحدار، تحدث العلاقة الخطية المتعددة عندما يكون هناك ارتباط بين متغيرين أو أكثر من متغيرات التوقع بشكل كبير مع بعضها البعض، بحيث لا توفر معلومات فريدة أو مستقلة في نموذج الانحدار.

إذا كانت درجة الارتباط عالية بما يكفي بين المتغيرات، فقد يتسبب ذلك في حدوث مشكلات عند ملاءمة نموذج الانحدار وتفسيره.

تتمثل إحدى طرق اكتشاف التعددية الخطية في استخدام مقياس يُعرف باسم عامل تضخم التباين (VIF) ، والذي يقيس الارتباط وقوة الارتباط بين المتغيرات التوضيحية في نموذج الانحدار .

يشرح هذا البرنامج التعليمي كيفية حساب VIF في SAS.

مثال: حساب VIF في SAS

في هذا المثال، سنقوم بإنشاء مجموعة بيانات تصف سمات 10 من لاعبي كرة السلة:

 /*create dataset*/
data my_data;
    input rating points assists rebounds;
    datalines ;
90 25 5 11
85 20 7 8
82 14 7 10
88 16 8 6
94 27 5 6
90 20 7 9
76 12 6 6
75 15 9 10
87 14 9 10
86 19 5 7
;
run ;

/*view dataset*/
proc print data =my_data; 

لنفترض أننا نريد ملاءمة نموذج الانحدار الخطي المتعدد باستخدام التسجيل كمتغير الاستجابة والنقاط والمساعدات والارتدادات كمتغيرات متوقعة.

يمكننا استخدام PROC REG لملاءمة نموذج الانحدار هذا مع خيار VIF لحساب قيم VIF لكل متغير متنبئ في النموذج:

 /*fit regression model and calculate VIF values*/
proc reg data =my_data;
    model rating = points assists rebounds / lively ;
run ; 

VIF في SAS

من جدول تقديرات المعلمة ، يمكننا رؤية قيم VIF لكل من متغيرات التوقع:

  • النقاط: 1.76398
  • التمريرات الحاسمة: 1.96591
  • الريباوند: 1.17503

ملحوظة: تجاهل VIF لـ “Intercept” في القالب لأن هذه القيمة ليست ذات صلة.

تبدأ قيمة VIF عند 1 وليس لها حد أعلى. القاعدة العامة لتفسير VIFs هي:

  • تشير القيمة 1 إلى عدم وجود ارتباط بين متغير توقع معين وأي متغير توقع آخر في النموذج.
  • تشير القيمة بين 1 و 5 إلى وجود علاقة معتدلة بين متغير متنبئ معين ومتغيرات تنبؤية أخرى في النموذج، ولكنها في كثير من الأحيان ليست شديدة بما يكفي لتتطلب اهتمامًا خاصًا.
  • تشير القيمة الأكبر من 5 إلى وجود علاقة جدية محتملة بين متغير توقع معين ومتغيرات توقع أخرى في النموذج. في هذه الحالة، من المحتمل أن تكون تقديرات المعامل والقيم الاحتمالية في نتائج الانحدار غير موثوقة.

نظرًا لأن كل قيمة من قيم VIF لمتغيرات التوقع في نموذج الانحدار الخاص بنا تقترب من 1، فإن التعددية الخطية ليست مشكلة في مثالنا.

كيفية التعامل مع التعددية الخطية

إذا حددت أن العلاقة الخطية المتعددة تمثل مشكلة في نموذج الانحدار الخاص بك، فهناك عدة طرق شائعة لحلها:

1. قم بإزالة واحد أو أكثر من المتغيرات شديدة الارتباط.

يعد هذا هو الحل الأسرع في معظم الحالات وغالبًا ما يكون حلاً مقبولاً لأن المتغيرات التي تقوم بإزالتها تكون زائدة عن الحاجة على أي حال وتضيف القليل من المعلومات الفريدة أو المستقلة إلى النموذج.

2. يجمع المتغيرات المتنبئة بشكل خطي بطريقة ما، مثل إضافتها أو طرحها بطريقة ما.

ومن خلال القيام بذلك، يمكنك إنشاء متغير جديد يشمل المعلومات من كلا المتغيرين ولن تعد لديك مشكلة تعدد الخطية.

3. قم بإجراء تحليل مصمم لمراعاة المتغيرات شديدة الارتباط مثل تحليل المكون الرئيسي أو انحدار المربعات الصغرى الجزئية (PLS).

تم تصميم هذه التقنيات خصيصًا للتعامل مع متغيرات التوقع شديدة الارتباط.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في SAS:

كيفية إجراء الانحدار الخطي المتعدد في SAS
كيفية إنشاء قطعة أرض متبقية في SAS
كيفية حساب مسافة الطهي في SAS

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *