فرضيات الانحدار اللوجستي الستة (مع أمثلة)


الانحدار اللوجستي هو طريقة يمكننا استخدامها لتناسب نموذج الانحدار عندما يكون متغير الاستجابة ثنائيًا.

قبل ملاءمة النموذج لمجموعة بيانات، يقوم الانحدار اللوجستي بوضع الافتراضات التالية:

الافتراض رقم 1: متغير الاستجابة ثنائي

يفترض الانحدار اللوجستي أن متغير الاستجابة له نتيجتان محتملتان فقط. وهنا بعض الأمثلة:

  • نعم أو لا
  • ذكر أم أنثى
  • تنجح أو تفشل
  • مكتوبة أو غير مكتوبة
  • خبيثة أو حميدة

كيفية التحقق من هذا الافتراض: ما عليك سوى حساب عدد النتائج الفريدة التي تحدث في متغير الاستجابة. إذا كان هناك أكثر من نتيجتين محتملتين، فستحتاج إلى إجراء الانحدار الترتيبي بدلاً من ذلك.

الفرضية رقم 2: الملاحظات مستقلة

يفترض الانحدار اللوجستي أن الملاحظات في مجموعة البيانات مستقلة عن بعضها البعض. أي أن الملاحظات لا ينبغي أن تأتي من قياسات متكررة لنفس الفرد أو أن تكون مرتبطة ببعضها البعض بأي شكل من الأشكال.

كيفية اختبار هذه الفرضية: إن أبسط طريقة لاختبار هذه الفرضية هي إنشاء مخطط للبقايا مقابل الزمن (أي ترتيب الملاحظات) وملاحظة ما إذا كان هناك اتجاه عشوائي أم لا. إذا لم يكن هناك نمط عشوائي، قد يتم انتهاك هذا الافتراض.

الفرضية رقم 3: لا يوجد تعدد خطي بين المتغيرات التفسيرية

ويفترض الانحدار اللوجستي عدم وجود علاقة خطية جدية بين المتغيرات التفسيرية .

تحدث العلاقة الخطية المتعددة عندما يرتبط متغيران تفسيريان أو أكثر ارتباطًا وثيقًا ببعضهما البعض، بحيث لا يوفران معلومات فريدة أو مستقلة في نموذج الانحدار. إذا كانت درجة الارتباط عالية بما يكفي بين المتغيرات، فقد يتسبب ذلك في حدوث مشكلات عند ملاءمة النموذج وتفسيره.

على سبيل المثال، لنفترض أنك تريد إجراء انحدار لوجستي باستخدام الحد الأقصى للقفز الرأسي كمتغير الاستجابة والمتغيرات التالية كمتغيرات توضيحية:

  • حجم اللاعب
  • حجم اللاعب
  • الساعات التي يقضيها في ممارسة يوميا

في هذه الحالة، من المحتمل أن يكون الطول وحجم الحذاء مرتبطين بشكل كبير لأن الأشخاص الأطول يميلون إلى الحصول على أحجام أحذية أكبر. وهذا يعني أن التعددية الخطية من المحتمل أن تكون مشكلة إذا استخدمنا هذين المتغيرين في الانحدار.

كيفية التحقق من هذا الافتراض: الطريقة الأكثر شيوعًا لاكتشاف التعددية الخطية هي استخدام عامل تضخم التباين (VIF)، الذي يقيس الارتباط وقوة الارتباط بين متغيرات التوقع في نموذج الانحدار. راجع هذا البرنامج التعليمي للحصول على شرح مفصل لكيفية حساب وتفسير قيم VIF.

الافتراض رقم 4: لا توجد قيم متطرفة

يفترض الانحدار اللوجستي عدم وجود قيم متطرفة أو ملاحظات مؤثرة في مجموعة البيانات.

كيفية التحقق من هذا الافتراض: الطريقة الأكثر شيوعًا لاختبار القيم المتطرفة والملاحظات المؤثرة في مجموعة البيانات هي حساب مسافة كوك لكل ملاحظة. إذا كانت هناك بالفعل قيم متطرفة، فيمكنك اختيار (1) إزالتها، (2) استبدالها بقيمة مثل المتوسط أو الوسيط، أو (3) الاحتفاظ بها ببساطة في النموذج مع تدوينها عند الإبلاغ عن الانحدار . نتائج.

الفرضية رقم 5: هناك علاقة خطية بين المتغيرات التوضيحية ولوغاريتم متغير الاستجابة

يفترض الانحدار اللوجستي وجود علاقة خطية بين كل متغير توضيحي ولوغاريتم متغير الاستجابة. تذكر أن السجل تم تعريفه على النحو التالي:

Logit(p) = log(p / (1-p)) حيث p هو احتمال نتيجة إيجابية.

كيفية اختبار هذه الفرضية: أسهل طريقة لمعرفة ما إذا كانت هذه الفرضية صحيحة هي استخدام اختبار بوكس تيدويل.

الافتراض رقم 6: حجم العينة كبير بما فيه الكفاية

يفترض الانحدار اللوجستي أن حجم عينة مجموعة البيانات كبير بما يكفي لاستخلاص استنتاجات صحيحة من نموذج الانحدار اللوجستي المجهز.

كيفية التحقق من هذه الفرضية: كقاعدة عامة، يجب أن يكون لديك ما لا يقل عن 10 حالات مع النتيجة الأقل تكرارًا لكل متغير توضيحي. على سبيل المثال، إذا كان لديك 3 متغيرات توضيحية وكان الاحتمال المتوقع للنتيجة الأقل تكرارًا هو 0.20، فيجب أن يكون حجم العينة لديك على الأقل (10*3) / 0.20 = 150 .

افتراضات الانحدار اللوجستي مقابل. الانحدارالخطي

على عكس الانحدار الخطي، لا يتطلب الانحدار اللوجستي ما يلي:

  • علاقة خطية بين المتغير (المتغيرات) التوضيحية ومتغير الاستجابة.
  • يتم توزيع بقايا النموذج بشكل طبيعي.
  • يجب أن يكون للمتبقيات تباين ثابت، والمعروف أيضًا باسم التجانس .

ذات صلة: الافتراضات الأربعة للانحدار الخطي

مصادر إضافية

4 أمثلة لاستخدام الانحدار اللوجستي في الحياة الحقيقية
كيفية إجراء الانحدار اللوجستي في SPSS
كيفية تنفيذ الانحدار اللوجستي في إكسيل
كيفية إجراء الانحدار اللوجستي في ستاتا

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *