ما هو الملوخية؟ سي بي؟ (تعريف ومثال)
Mallows Cp هو مقياس يستخدم لاختيار أفضل نموذج انحدار من بين عدة نماذج مختلفة.
يتم حسابه على النحو التالي:
Cp = RSS ع /S 2 – N + 2(P+1)
ذهب:
- RSS p : مجموع المربعات المتبقية لنموذج بمتغيرات توقع p
- S 2 : مربع المتوسط المتبقي للنموذج (مقدر بواسطة MSE)
- ن: حجم العينة
- P: عدد متغيرات التوقع
يتم استخدام Mallows Cp عندما يكون لدينا العديد من متغيرات التوقع المحتملة التي نرغب في استخدامها في نموذج الانحدار ونريد تحديد أفضل نموذج يستخدم مجموعة فرعية من متغيرات التوقع هذه.
يمكننا تحديد نموذج الانحدار “الأفضل” من خلال تحديد النموذج ذي أقل قيمة Cp أقل من P+1، حيث P هو عدد المتغيرات المتوقعة في النموذج.
يوضح المثال التالي كيفية استخدام Mallows’ Cp لتحديد أفضل نموذج انحدار من عدة نماذج محتملة.
مثال: استخدام Mallows Cp لاختيار النموذج الأفضل
لنفترض أن الأستاذ يريد استخدام ساعات الدراسة والامتحانات التحضيرية التي تم إجراؤها والمعدل التراكمي الحالي كمتغيرات تنبؤية في نموذج الانحدار للتنبؤ بالدرجة التي سيحصل عليها الطالب في الاختبار النهائي.
يناسب سبعة نماذج انحدار مختلفة ويحسب قيمة Mallows Cp لكل نموذج:
إذا كانت قيمة Mallow’s Cp أقل من عدد معاملات النموذج (P+1)، يقال أن النموذج غير متحيز.
يمكننا أن نرى أن هناك نموذجين محايدين:
- النموذج الذي يحتوي على الساعات والمعدل التراكمي كمتغيرات متوقعة (Mallow’s Cp = 2.9، P+1 = 3)
- النموذج الذي يحتوي على اختبارات الإعدادية والمعدل التراكمي كمتغيرات متوقعة (Mallow’s Cp = 2.7، P+1 = 3)
من بين هذين النموذجين، فإن النموذج الذي يستخدم الامتحانات التحضيرية والمعدل التراكمي كمتغيرات تنبؤية لديه أقل قيمة لـ Mallows’ Cp، مما يخبرنا أن النموذج الأفضل هو الذي ينتج عنه أقل تحيز.
ملاحظات على Cp des mauves
فيما يلي بعض الأشياء التي يجب وضعها في الاعتبار بشأن Mallows Cp:
- يُقال إن النماذج التي تحتوي على قيمة Mallows Cp قريبة من P+1 لديها انحياز منخفض.
- إذا كان لكل نموذج محتمل قيمة Mallows Cp عالية، فهذا يشير إلى أن بعض المتغيرات المتوقعة المهمة من المحتمل أن تكون مفقودة من كل نموذج.
- إذا كان لدى العديد من النماذج المحتملة قيم منخفضة لـ Mallow’s Cp، فاختر النموذج ذو القيمة الأقل كأفضل نموذج يمكن استخدامه.
ضع في اعتبارك أيضًا أن Mallows ‘Cp هي مجرد طريقة واحدة لقياس مدى ملاءمة نموذج الانحدار.
مقياس آخر شائع الاستخدام هو R-squared المعدل، والذي يخبرنا بنسبة التباين في متغير الاستجابة الذي يمكن تفسيره بواسطة متغيرات التوقع في النموذج، مع تعديله لعدد متغيرات التوقع المستخدمة.
لتحديد نموذج الانحدار الأفضل من قائمة تضم العديد من النماذج المختلفة، من الجيد النظر إلى كل من Mallows ‘Cp وR-squared المعدل.