كيفية حساب aic في r (بما في ذلك الأمثلة)


يعد معيار معلومات Akaike (AIC) مقياسًا يستخدم لمقارنة ملاءمة نماذج الانحدار المتعددة.

يتم حسابه على النحو التالي:

AIC = 2K – 2 لتر (L)

ذهب:

  • K: عدد معلمات النموذج. القيمة الافتراضية لـ K هي 2، وبالتالي فإن النموذج الذي يحتوي على متغير توقع واحد فقط سيكون له قيمة K هي 2+1 = 3.
  • ln (L) : الاحتمالية اللوغاريتمية للنموذج. يمكن لمعظم البرامج الإحصائية حساب هذه القيمة لك تلقائيًا.

تم تصميم AIC للعثور على النموذج الذي يفسر أكبر قدر من الاختلاف في البيانات، مع معاقبة النماذج التي تستخدم عددًا مفرطًا من المعلمات.

بمجرد تركيب نماذج الانحدار المتعددة، يمكنك مقارنة قيمة AIC لكل نموذج. كلما انخفض AIC، كان النموذج أكثر ملاءمة.

لحساب AIC لنماذج الانحدار المتعددة في R، يمكننا استخدام الدالة aictab() من الحزمة AICcmodavg .

يوضح المثال التالي كيفية استخدام هذه الوظيفة لحساب وتفسير AIC لنماذج الانحدار المختلفة في R.

مثال: حساب وتفسير AIC في R

لنفترض أننا نريد ملاءمة ثلاثة نماذج انحدار خطي متعددة مختلفة باستخدام متغيرات من مجموعة بيانات mtcars .

فيما يلي المتغيرات المتوقعة التي سنستخدمها في كل نموذج:

  • متغيرات التوقع في النموذج 1: disp، hp، wt، qsec
  • متغيرات التوقع في النموذج 2: disp، qsec
  • متغيرات التوقع في النموذج 3: disp، wt

يوضح التعليمة البرمجية التالية كيفية ملاءمة كل من نماذج الانحدار هذه:

 #fit three models
model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

بعد ذلك، سنضع النماذج في قائمة ونستخدم الدالة aictab() لحساب AIC لكل نموذج:

 library (AICcmodavg)

#define list of models
models <- list(model1, model2, model3)

#specify model names
mod.names <- c('disp.hp.wt.qsec', 'disp.qsec', 'disp.wt')

#calculate AIC of each model
aictab(cand.set = models, modnames = mod.names)

Model selection based on AICc:

                K AICc Delta_AICc AICcWt Cum.Wt LL
disp.hp.wt.qsec 6 162.43 0.00 0.83 0.83 -73.53
available wt 4 165.65 3.22 0.17 1.00 -78.08
disp.qsec 4 173.32 10.89 0.00 1.00 -81.92

وإليك كيفية تفسير النتيجة:

  • K: عدد المعلمات في النموذج.
  • AICc: قيمة AIC للنموذج. يشير الحرف الصغير “c” إلى أنه تم حساب AIC من AIC المصحح للعينات الصغيرة.
  • Delta_AICc: الفرق بين AIC للنموذج الأفضل والنموذج الحالي مقارنة.
  • AICcWt: نسبة إجمالي القدرة التنبؤية التي يمكن العثور عليها في النموذج.
  • Cum.Wt : المجموع التراكمي لأوزان AIC.
  • LL: احتمالية السجل للنموذج. وهذا يخبرنا بمدى احتمالية النموذج، في ضوء البيانات التي استخدمناها.

يتم دائمًا إدراج النموذج ذو أدنى قيمة لـ AIC أولاً. من النتيجة يمكننا أن نرى أن النموذج التالي لديه أقل قيمة AIC وبالتالي فهو النموذج الأفضل المناسب:

ميلا في الغالون = β 0 + β 1 (disp) + β 2 (حصان) + β 3 (الوزن) + β 4 (qsec)

بمجرد تحديد هذا النموذج على أنه الأفضل، يمكننا المضي قدمًا في ملاءمة النموذج وتحليل النتائج، بما في ذلك قيمة R-squared ومعاملات بيتا، لتحديد العلاقة الدقيقة بين مجموعة المتغيرات التنبؤية ومتغير الاستجابة .

مصادر إضافية

كيفية إجراء الانحدار الخطي البسيط في R
كيفية إجراء الانحدار الخطي المتعدد في R
كيفية حساب R-squared المعدل في R
كيفية حساب Mallows Cp في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *