كيفية حساب اللون الأرجواني 'cp في r


في تحليل الانحدار، يعد Mallows Cp مقياسًا يستخدم لاختيار أفضل نموذج انحدار من بين العديد من النماذج المحتملة.

يمكننا تحديد نموذج الانحدار “الأفضل” من خلال تحديد النموذج ذي أقل قيمة Cp قريبة من p +1، حيث p هو عدد المتغيرات المتوقعة في النموذج.

أسهل طريقة لحساب Cp of Mallows في R هي استخدام الدالة ols_mallows_cp() من الحزمة olsrr .

يوضح المثال التالي كيفية استخدام هذه الوظيفة لحساب Mallows’ Cp لتحديد أفضل نموذج انحدار من بين العديد من النماذج المحتملة في R.

مثال: حساب Mallows Cp في R

لنفترض أننا نريد ملاءمة ثلاثة نماذج انحدار خطي متعددة مختلفة باستخدام متغيرات من مجموعة بيانات mtcars .

يوضح التعليمة البرمجية التالية كيفية ملاءمة نماذج الانحدار التالية:

  • المتغيرات المتوقعة في النموذج الكامل: المتغيرات العشرة
  • متغيرات التوقع في النموذج 1: disp، hp، wt، qsec
  • متغيرات التوقع في النموذج 2: disp، qsec
  • متغيرات التوقع في النموذج 3: disp، wt

يوضح التعليمة البرمجية التالية كيفية ملاءمة كل نموذج من نماذج الانحدار هذه واستخدام الدالة ols_mallows_cp() لحساب Mallows Cp لكل نموذج:

 library (olsrr)

#fit full model
full_model <- lm(mpg ~ ., data = mtcars)

#fit three smaller models
model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

#calculate Mallows' Cp for each model
ols_mallows_cp(model1, full_model)

[1] 4.430434

ols_mallows_cp(model2, full_model)

[1] 18.64082

ols_mallows_cp(model3, full_model)

[1] 9.122225

وإليك كيفية تفسير النتيجة:

  • النموذج 1: ع + 1 = 5، الملوخية Cp = 4.43
  • النموذج 2: ع + 1 = 3، الملوخية Cp = 18.64
  • النموذج 3: ع + 1 = 30، الملوخية Cp = 9.12

يمكننا أن نرى أن النموذج 1 له قيمة لـ Mallows’ Cp الأقرب إلى p + 1، مما يشير إلى أنه النموذج الأفضل الذي يؤدي إلى أقل انحياز بين النماذج الثلاثة المحتملة.

ملاحظات على Cp des mauves

فيما يلي بعض الأشياء التي يجب وضعها في الاعتبار بشأن Mallows Cp:

  • إذا كان لكل نموذج محتمل قيمة Mallows Cp عالية، فهذا يشير إلى أن بعض المتغيرات المتوقعة المهمة من المحتمل أن تكون مفقودة من كل نموذج.
  • إذا كان لدى العديد من النماذج المحتملة قيم منخفضة لـ Mallow’s Cp، فاختر النموذج ذو القيمة الأقل كأفضل نموذج يمكن استخدامه.

ضع في اعتبارك أن Mallows ‘Cp هي مجرد طريقة واحدة لتحديد نموذج الانحدار “الأفضل” بين العديد من النماذج المحتملة.

مقياس آخر شائع الاستخدام هو R-squared المعدل، والذي يخبرنا بنسبة التباين في متغير الاستجابة الذي يمكن تفسيره بواسطة متغيرات التوقع في النموذج، مع تعديله لعدد متغيرات التوقع المستخدمة.

لتحديد نموذج الانحدار الأفضل من بين قائمة من عدة نماذج مختلفة، يوصى بالنظر إلى كل من Mallows’ Cp وR-squared المعدل.

مصادر إضافية

كيفية حساب R-squared المعدل في R
كيفية حساب AIC في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *