الافتراضات الخمسة للانحدار الخطي المتعدد


الانحدار الخطي المتعدد هو طريقة إحصائية يمكننا استخدامها لفهم العلاقة بين متغيرات التوقع المتعددة ومتغير الاستجابة .

ومع ذلك، قبل إجراء الانحدار الخطي المتعدد، يجب علينا أولاً التأكد من استيفاء خمسة افتراضات:

1. العلاقة الخطية: توجد علاقة خطية بين كل متغير متنبئ ومتغير الاستجابة.

2. لا توجد علاقة خطية متعددة: لا يوجد ارتباط كبير بين متغيرات التوقع مع بعضها البعض.

3. الاستقلال: الملاحظات مستقلة.

4. التجانس: للبواقي تباين ثابت عند كل نقطة من النموذج الخطي.

5. الحالة الطبيعية متعددة المتغيرات: يتم توزيع بقايا النموذج بشكل طبيعي.

إذا لم يتم استيفاء واحد أو أكثر من هذه الافتراضات، فقد لا تكون نتائج الانحدار الخطي المتعدد موثوقة.

ونقدم في هذا المقال شرحًا لكل افتراض، وكيفية تحديد ما إذا كان الافتراض قد تحقق، وماذا تفعل إذا لم يتم استيفاء الافتراض.

الفرضية 1: العلاقة الخطية

يفترض الانحدار الخطي المتعدد وجود علاقة خطية بين كل متغير متنبئ ومتغير الاستجابة.

كيفية تحديد ما إذا كان هذا الافتراض قد تم استيفاءه

إن أبسط طريقة لتحديد ما إذا كان هذا الافتراض قد تم استيفاءه هو إنشاء مخطط انتشار لكل متغير متنبئ ومتغير الاستجابة.

يتيح لك ذلك معرفة ما إذا كانت هناك علاقة خطية بين المتغيرين بشكل مرئي.

إذا كانت النقاط في مخطط التشتت تقع تقريبًا على طول خط قطري مستقيم، فمن المحتمل أن تكون هناك علاقة خطية بين المتغيرات.

على سبيل المثال، يبدو أن النقاط في الرسم البياني أدناه تقع على خط مستقيم، مما يشير إلى وجود علاقة خطية بين متغير التوقع المحدد (x) ومتغير الاستجابة (y):

ماذا تفعل إذا لم يتم احترام هذا الافتراض

إذا لم تكن هناك علاقة خطية بين واحد أو أكثر من متغيرات التوقع ومتغير الاستجابة، فلدينا عدة خيارات:

1. قم بتطبيق تحويل غير خطي على متغير التوقع، على سبيل المثال أخذ السجل أو الجذر التربيعي. يمكن أن يؤدي هذا غالبًا إلى تحويل العلاقة إلى علاقة أكثر خطية.

2. أضف متغيرًا متوقعًا آخر إلى النموذج. على سبيل المثال، إذا كان الرسم البياني x مقابل y له شكل مكافئ، فقد يكون من المنطقي إضافة X 2 كمتغير توقع إضافي في النموذج.

3. قم بإزالة المتغير المتوقع من النموذج. في الحالة القصوى، إذا لم تكن هناك علاقة خطية بين متغير متنبئ معين ومتغير الاستجابة، فقد لا يكون من المفيد تضمين متغير المتنبئ في النموذج.

الفرضية 2: لا توجد علاقة خطية متعددة

يفترض الانحدار الخطي المتعدد عدم ارتباط أي من متغيرات التوقع بشكل كبير مع بعضها البعض.

عندما يكون هناك ارتباط كبير بين واحد أو أكثر من المتغيرات المتوقعة، يعاني نموذج الانحدار من تعدد الخطية ، مما يجعل تقديرات معامل النموذج غير موثوقة.

كيفية تحديد ما إذا كان هذا الافتراض قد تم استيفاءه

إن أبسط طريقة لتحديد ما إذا كان هذا الافتراض قد تم استيفاءه هو حساب قيمة VIF لكل متغير متنبئ.

تبدأ قيم VIF عند 1 وليس لها حد أعلى. بشكل عام، تشير قيم VIF الأعلى من 5* إلى وجود علاقة خطية متعددة محتملة.

توضح البرامج التعليمية التالية كيفية حساب VIF في البرامج الإحصائية المختلفة:

*في بعض الأحيان يستخدم الباحثون قيمة VIF بقيمة 10 بدلاً من ذلك، اعتمادًا على مجال الدراسة.

ماذا تفعل إذا لم يتم احترام هذا الافتراض

إذا كان لواحد أو أكثر من متغيرات التوقع قيمة VIF أكبر من 5، فإن أسهل طريقة لحل هذه المشكلة هي ببساطة إزالة متغير (متغيرات) التوقع ذات قيم VIF العالية.

وبدلاً من ذلك، إذا كنت تريد الاحتفاظ بكل متغير تنبؤي في النموذج، فيمكنك استخدام طريقة إحصائية مختلفة، مثل انحدار التلال ، أو انحدار لاسو ، أو انحدار المربعات الصغرى الجزئية ، المصممة للتعامل مع متغيرات التوقع شديدة الارتباط.

الفرضية 3: الاستقلال

يفترض الانحدار الخطي المتعدد أن كل ملاحظة في مجموعة البيانات مستقلة.

كيفية تحديد ما إذا كان هذا الافتراض قد تم استيفاءه

إن أبسط طريقة لتحديد ما إذا كان هذا الافتراض قد تم استيفاءه هو إجراء اختبار دوربين-واتسون ، وهو اختبار إحصائي رسمي يخبرنا ما إذا كانت البقايا (وبالتالي الملاحظات) تظهر ارتباطًا ذاتيًا أم لا.

ماذا تفعل إذا لم يتم احترام هذا الافتراض

اعتمادًا على كيفية انتهاك هذا الافتراض، لديك عدة خيارات:

  • للحصول على ارتباط تسلسلي إيجابي، فكر في إضافة فترات تأخر المتغير التابع و/أو المستقل إلى النموذج.
  • بالنسبة للارتباط التسلسلي السلبي، تأكد من عدم تأخر أي من متغيراتك بشكل زائد .
  • بالنسبة للارتباط الموسمي، فكر في إضافة نماذج موسمية إلى النموذج.

الفرضية 4: المثلية

يفترض الانحدار الخطي المتعدد أن البقايا لها تباين ثابت عند كل نقطة في النموذج الخطي. عندما لا يكون الأمر كذلك، فإن البقايا تعاني من عدم تجانسها .

عندما تكون التغايرية موجودة في تحليل الانحدار، تصبح نتائج نموذج الانحدار غير موثوقة.

على وجه التحديد، تزيد التغايرية من التباين في تقديرات معامل الانحدار، لكن نموذج الانحدار لا يأخذ في الاعتبار ذلك. وهذا يجعل من الأرجح أن يدعي نموذج الانحدار أن المصطلح الموجود في النموذج له دلالة إحصائية، في حين أنه ليس كذلك في الواقع.

كيفية تحديد ما إذا كان هذا الافتراض قد تم استيفاءه

أسهل طريقة لتحديد ما إذا كان هذا الافتراض قد تم استيفاءه هي إنشاء مخطط للقيم المتبقية مقابل القيم المتوقعة.

بمجرد ملاءمة نموذج الانحدار لمجموعة بيانات، يمكنك إنشاء مخطط تبعثر يعرض القيم المتوقعة لمتغير الاستجابة على المحور السيني والمتبقيات القياسية للنموذج على المحور السيني. ذ.

إذا أظهرت النقاط في مخطط التشتت اتجاهًا، فإن التغايرية موجودة.

يوضح الرسم البياني التالي مثالاً لنموذج الانحدار الذي لا تمثل فيه عدم التجانس مشكلة:

لاحظ أن المخلفات الموحدة متناثرة حول الصفر بدون نمط واضح.

يوضح الرسم البياني التالي مثالاً لنموذج الانحدار حيث تمثل عدم تجانس التغاير مشكلة:

لاحظ كيف تنتشر البقايا الموحدة أكثر فأكثر مع زيادة القيم المتوقعة. هذا الشكل “المخروطي” هو علامة كلاسيكية على التغايرية:

ماذا تفعل إذا لم يتم احترام هذا الافتراض

هناك ثلاث طرق شائعة لتصحيح عدم التجانس:

1. تحويل متغير الاستجابة. الطريقة الأكثر شيوعًا للتعامل مع التغايرية هي تحويل متغير الاستجابة عن طريق أخذ السجل أو الجذر التربيعي أو الجذر التكعيبي لجميع قيم متغير الاستجابة. يؤدي هذا غالبًا إلى اختفاء التباين.

2. إعادة تعريف متغير الاستجابة. إحدى الطرق لإعادة تعريف متغير الاستجابة هي استخدام المعدل بدلاً من القيمة الأولية. على سبيل المثال، بدلاً من استخدام حجم السكان للتنبؤ بعدد بائعي الزهور في المدينة، يمكننا استخدام حجم السكان للتنبؤ بعدد بائعي الزهور للفرد.

في معظم الحالات، يؤدي هذا إلى تقليل التباين الذي يحدث بشكل طبيعي ضمن مجموعات سكانية أكبر نظرًا لأننا نقيس عدد بائعي الزهور لكل شخص، بدلاً من عدد بائعي الزهور نفسه.

3. استخدم الانحدار المرجح. هناك طريقة أخرى لتصحيح التغايرية وهي استخدام الانحدار المرجح، الذي يعين وزنًا لكل نقطة بيانات بناءً على تباين قيمتها المجهزة.

بشكل أساسي، يعطي هذا أوزانًا منخفضة لنقاط البيانات التي تحتوي على تباينات أعلى، مما يقلل من مربعاتها المتبقية. عند استخدام الأوزان المناسبة، يمكن أن يؤدي ذلك إلى القضاء على مشكلة التغايرية.

ذات صلة : كيفية إجراء الانحدار المرجح في R

الافتراض 4: الحالة الطبيعية متعددة المتغيرات

يفترض الانحدار الخطي المتعدد أن بقايا النموذج يتم توزيعها بشكل طبيعي.

كيفية تحديد ما إذا كان هذا الافتراض قد تم استيفاءه

هناك طريقتان شائعتان للتحقق من استيفاء هذا الافتراض:

1. تحقق بصريًا من الفرضية باستخدام مخططات QQ .

مخطط QQ، وهو اختصار لمخطط الكم الكمي، هو نوع من المخطط الذي يمكننا استخدامه لتحديد ما إذا كانت بقايا النموذج تتبع التوزيع الطبيعي أم لا. إذا كانت النقاط الموجودة على قطعة الأرض تشكل خطًا قطريًا مستقيمًا تقريبًا، فإن افتراض الحالة الطبيعية قد تحقق.

يُظهر مخطط QQ التالي مثالاً على المخلفات التي تتبع تقريبًا التوزيع الطبيعي:

ومع ذلك، فإن مخطط QQ أدناه يوضح مثالاً لحالة تنحرف فيها البقايا بوضوح عن خط قطري مستقيم، مما يشير إلى أنها لا تتبع التوزيع الطبيعي:

2. تحقق من الفرضية باستخدام اختبار إحصائي رسمي مثل Shapiro-Wilk، أو Kolmogorov-Smironov، أو Jarque-Barre، أو D’Agostino-Pearson.

ضع في اعتبارك أن هذه الاختبارات حساسة لأحجام العينات الكبيرة – أي أنها غالبًا ما تستنتج أن المخلفات ليست طبيعية عندما يكون حجم عينتك كبيرًا للغاية. ولهذا السبب غالبًا ما يكون من الأسهل استخدام الأساليب الرسومية مثل مخطط QQ للتحقق من هذه الفرضية.

ماذا تفعل إذا لم يتم احترام هذا الافتراض

إذا لم يتم استيفاء افتراض الحالة الطبيعية، فلديك عدة خيارات:

1. أولاً، تأكد من عدم وجود قيم متطرفة في البيانات تؤدي إلى انتهاك الافتراض الطبيعي.

2. بعد ذلك يمكنك تطبيق تحويل غير خطي على متغير الاستجابة، على سبيل المثال عن طريق أخذ الجذر التربيعي أو السجل أو الجذر التكعيبي لجميع قيم متغير الاستجابة. يؤدي هذا غالبًا إلى توزيع أكثر طبيعية لبقايا النموذج.

مصادر إضافية

توفر البرامج التعليمية التالية معلومات إضافية حول الانحدار الخطي المتعدد وافتراضاته:

مقدمة في الانحدار الخطي المتعدد
دليل للتغايرية في تحليل الانحدار
دليل للتعددية الخطية وVIF في الانحدار

توفر البرامج التعليمية التالية أمثلة خطوة بخطوة حول كيفية إجراء الانحدار الخطي المتعدد باستخدام برامج إحصائية مختلفة:

كيفية تنفيذ الانحدار الخطي المتعدد في إكسيل
كيفية إجراء الانحدار الخطي المتعدد في R
كيفية إجراء الانحدار الخطي المتعدد في SPSS
كيفية إجراء الانحدار الخطي المتعدد في ستاتا

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *