متعددة الخطية

تشرح هذه المقالة ما هي العلاقة الخطية المتعددة في الإحصائيات. لذلك، سوف تكتشف متى توجد تعدد الخطيات، وما هي عواقب التعدد الخطي، وكيفية تحديد التعدد الخطي، وأخيرًا، كيفية حل هذه المشكلة.

ما هو متعدد الخطية؟

تعد العلاقة الخطية المتعددة حالة تحدث عندما يكون هناك ارتباط كبير بين متغيرين توضيحيين أو أكثر في نموذج الانحدار. بمعنى آخر، في نموذج الانحدار، توجد علاقة خطية متعددة عندما تكون العلاقة بين متغيرين أو أكثر في النموذج قوية جدًا.

على سبيل المثال، إذا قمنا بتشغيل نموذج انحدار يربط متوسط العمر المتوقع لبلد ما بحجم السكان والناتج المحلي الإجمالي، فمن المؤكد أن العلاقة الخطية المتعددة ستحدث بين حجم السكان والناتج المحلي الإجمالي، حيث أن هذين المتغيرين يرتبطان بقوة بشكل عام. مترابطة. ولذلك سيكون من الصعب تحليل تأثير كل متغير على متوسط العمر المتوقع.

ومن الناحية المنطقية، فإن المتغيرات في النموذج ستكون دائمًا مرتبطة ببعضها البعض؛ فقط في العملية المثالية يحدث عدم الارتباط بين المتغيرات. لكن ما يهمنا هو أن يكون الارتباط بين المتغيرات منخفضا، وإلا فلن نتمكن من معرفة تأثير كل متغير تفسيري على متغير الاستجابة.

الأسباب الرئيسية للتعددية الخطية هي بشكل عام صغر حجم العينة، أو وجود علاقة سببية بين المتغيرات التوضيحية أو التباين المنخفض للملاحظات.

أنواع التعددية الخطية

هناك نوعان من التعددية الخطية:

  • العلاقة الخطية المتعددة الدقيقة : عندما يكون متغير واحد أو أكثر عبارة عن مجموعة خطية من المتغيرات الأخرى. في هذه الحالة، معامل الارتباط بين المتغيرات متعددة الخطية يساوي 1.
  • العلاقة الخطية التقريبية : لا يوجد مزيج خطي بين المتغيرات، ولكن معامل التحديد بين متغيرين أو أكثر قريب جدًا من 1 وبالتالي فهي مرتبطة بشكل كبير.

عواقب التعددية الخطية

  • تتغير قيمة معاملات الانحدار الخاصة بالنموذج عند إضافة المتغيرات المرتبطة، مما يجعل من الصعب تفسير نموذج الانحدار الناتج.
  • يتم تقليل دقة تقدير المعلمة، وبالتالي يزداد الخطأ المعياري لمعاملات الانحدار.
  • من المؤكد أن بعض المتغيرات المسببة للتعددية الخطية زائدة عن الحاجة وبالتالي ليست هناك حاجة لإدراجها في النموذج.
  • من المحتمل أن تقع في حالة فرط التجهيز، أي أن النموذج قد تم فرط تجهيزه، ولهذا السبب، فهو غير مفيد في عمل التنبؤات.
  • تصبح القيم p لمعاملات الانحدار أقل موثوقية. ولذلك، يكون من الصعب تحديد المتغيرات التي سيتم تضمينها والمتغيرات التي سيتم إزالتها في نموذج الانحدار.

كيفية الكشف عن التعددية الخطية

إحدى طرق تحديد العلاقة الخطية المتعددة هي حساب مصفوفة الارتباط ، لأنها تحتوي على معامل الارتباط بين جميع المتغيرات، وبالتالي يمكن ملاحظة ما إذا كان هناك زوج من المتغيرات مرتبط بشكل كبير.

ومع ذلك، باستخدام مصفوفة الارتباط، يمكنك فقط معرفة ما إذا كان هناك متغيرين مرتبطين ببعضهما البعض، ولكن لا يمكنك معرفة ما إذا كان هناك مجموعة بين مجموعة من المتغيرات. وللقيام بذلك، عادة ما يتم حساب عامل التضخم التباين.

عامل تضخم التباين (VIF) ، ويسمى أيضًا عامل تضخم التباين (VIF) ، هو معامل إحصائي يتم حسابه لكل متغير توضيحي ويشير إلى ارتباط المتغيرات الأخرى بمتغير توضيحي معين. وبشكل ملموس، صيغتها هي كما يلي:

FIV_i=\cfrac{1}{1-R_i^2}

ذهب

FIV_i

هو عامل التضخم لتباين المتغير iy

R_i^2

هو معامل تحديد نموذج الانحدار الذي يكون فيه المتغير i كمتغير تابع وبقية المتغيرات كمتغيرات مستقلة.

وبالتالي، اعتماداً على قيمة عوامل تضخم التباين التي تم الحصول عليها، يمكن معرفة ما إذا كانت هناك علاقة خطية متعددة أم لا:

  • VIF = 1 : عندما يكون عامل تضخم التباين يساوي 1، فهذا يعني أنه لا يوجد ارتباط بين المتغير التابع والمتغيرات الأخرى.
  • 1 < IVF < 5 : توجد علاقة ارتباط بين المتغيرات ولكنها متوسطة. من حيث المبدأ، ليس من الضروري تطبيق أي إجراء لتصحيح العلاقة الخطية المتعددة.
  • VIF > 5 : إذا كان عامل تضخم التباين أكبر من 1، فهذا يعني أن الخطية المتعددة للنموذج عالية، وبالتالي يجب محاولة حلها.

من الناحية العملية، عادة ما يتم حساب عوامل تضخم التباين باستخدام برامج الكمبيوتر، لأن إنشاء نموذج انحدار لكل متغير ومن ثم العثور على قيمة المعامل يدويًا قد يستغرق وقتًا طويلاً.

التعددية الصحيحة

يمكن أن تكون الإجراءات التالية مفيدة في حل مشكلات العلاقات الخطية المتعددة في نموذج الانحدار:

  • إذا كان حجم العينة صغيرًا، فإن زيادة عدد البيانات يمكن أن يؤدي إلى تقليل العلاقة الخطية المتعددة التقريبية.
  • قم بإزالة كافة المتغيرات التي تنتج علاقة خطية متداخلة. إذا كانت المتغيرات مرتبطة بشكل كبير، فسيتم فقدان القليل من المعلومات في النموذج وستنخفض العلاقة الخطية المتعددة.
  • قم بإنشاء نموذج الانحدار من خلال تطبيق معيار المربعات الصغرى الجزئية (PLS).
  • في بعض الأحيان يمكنك ترك نموذج الانحدار كما هو، مع وجود علاقة خطية متعددة. على سبيل المثال، إذا أردنا فقط إنشاء نموذج لإجراء تنبؤات ولا نحتاج إلى تفسيره، فيمكننا استخدام معادلة النموذج للتنبؤ بقيمة المتغير التابع بملاحظة جديدة، على افتراض أن نمط الخطية المتعددة يكرر نفسه في الملاحظات الجديدة.

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *