كيفية حساب اللون الأرجواني 'cp في r
في تحليل الانحدار، يعد Mallows Cp مقياسًا يستخدم لاختيار أفضل نموذج انحدار من بين العديد من النماذج المحتملة.
يمكننا تحديد نموذج الانحدار “الأفضل” من خلال تحديد النموذج ذي أقل قيمة Cp قريبة من p +1، حيث p هو عدد المتغيرات المتوقعة في النموذج.
أسهل طريقة لحساب Cp of Mallows في R هي استخدام الدالة ols_mallows_cp() من الحزمة olsrr .
يوضح المثال التالي كيفية استخدام هذه الوظيفة لحساب Mallows’ Cp لتحديد أفضل نموذج انحدار من بين العديد من النماذج المحتملة في R.
مثال: حساب Mallows Cp في R
لنفترض أننا نريد ملاءمة ثلاثة نماذج انحدار خطي متعددة مختلفة باستخدام متغيرات من مجموعة بيانات mtcars .
يوضح التعليمة البرمجية التالية كيفية ملاءمة نماذج الانحدار التالية:
- المتغيرات المتوقعة في النموذج الكامل: المتغيرات العشرة
- متغيرات التوقع في النموذج 1: disp، hp، wt، qsec
- متغيرات التوقع في النموذج 2: disp، qsec
- متغيرات التوقع في النموذج 3: disp، wt
يوضح التعليمة البرمجية التالية كيفية ملاءمة كل نموذج من نماذج الانحدار هذه واستخدام الدالة ols_mallows_cp() لحساب Mallows Cp لكل نموذج:
library (olsrr) #fit full model full_model <- lm(mpg ~ ., data = mtcars) #fit three smaller models model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars) model2 <- lm(mpg ~ disp + qsec, data = mtcars) model3 <- lm(mpg ~ disp + wt, data = mtcars) #calculate Mallows' Cp for each model ols_mallows_cp(model1, full_model) [1] 4.430434 ols_mallows_cp(model2, full_model) [1] 18.64082 ols_mallows_cp(model3, full_model) [1] 9.122225
وإليك كيفية تفسير النتيجة:
- النموذج 1: ع + 1 = 5، الملوخية Cp = 4.43
- النموذج 2: ع + 1 = 3، الملوخية Cp = 18.64
- النموذج 3: ع + 1 = 30، الملوخية Cp = 9.12
يمكننا أن نرى أن النموذج 1 له قيمة لـ Mallows’ Cp الأقرب إلى p + 1، مما يشير إلى أنه النموذج الأفضل الذي يؤدي إلى أقل انحياز بين النماذج الثلاثة المحتملة.
ملاحظات على Cp des mauves
فيما يلي بعض الأشياء التي يجب وضعها في الاعتبار بشأن Mallows Cp:
- إذا كان لكل نموذج محتمل قيمة Mallows Cp عالية، فهذا يشير إلى أن بعض المتغيرات المتوقعة المهمة من المحتمل أن تكون مفقودة من كل نموذج.
- إذا كان لدى العديد من النماذج المحتملة قيم منخفضة لـ Mallow’s Cp، فاختر النموذج ذو القيمة الأقل كأفضل نموذج يمكن استخدامه.
ضع في اعتبارك أن Mallows ‘Cp هي مجرد طريقة واحدة لتحديد نموذج الانحدار “الأفضل” بين العديد من النماذج المحتملة.
مقياس آخر شائع الاستخدام هو R-squared المعدل، والذي يخبرنا بنسبة التباين في متغير الاستجابة الذي يمكن تفسيره بواسطة متغيرات التوقع في النموذج، مع تعديله لعدد متغيرات التوقع المستخدمة.
لتحديد نموذج الانحدار الأفضل من بين قائمة من عدة نماذج مختلفة، يوصى بالنظر إلى كل من Mallows’ Cp وR-squared المعدل.