كيفية تفسير الانحراف الفارغ والمتبقي (مع أمثلة)
عندما تناسب نموذجًا خطيًا عامًا (مثل الانحدار اللوجستي، وانحدار بواسون، وما إلى ذلك)، تنتج معظم البرامج الإحصائية قيمًا للانحراف الصفري والانحراف المتبقي للنموذج.
يخبرنا الانحراف الصفري بمدى إمكانية التنبؤ بمتغير الاستجابة من خلال نموذج يحتوي على مصطلح أصلي فقط.
يخبرنا الانحراف المتبقي عن مدى إمكانية التنبؤ بمتغير الاستجابة من خلال نموذج يحتوي على متغيرات توقعية . كلما انخفضت القيمة، كانت قدرة النموذج على التنبؤ بقيمة متغير الاستجابة أفضل.
لتحديد ما إذا كان النموذج “مفيدًا”، يمكننا حساب إحصائية مربع كاي كما يلي:
X 2 = انحراف صفر – انحراف متبقي
مع درجات الحرية.
يمكننا بعد ذلك إيجاد القيمة الاحتمالية المرتبطة بإحصائيات مربع كاي. كلما انخفضت القيمة الاحتمالية، كانت قدرة النموذج على ملاءمة مجموعة البيانات أفضل مقارنة بالنموذج الذي يحتوي على مصطلح أصلي فقط.
يوضح المثال التالي كيفية تفسير الانحراف الصفري والمتبقي لنموذج الانحدار اللوجستي في R.
مثال: تفسير الصفر والانحراف المتبقي
في هذا المثال، سوف نستخدم مجموعة البيانات الافتراضية من حزمة ISLR. يمكننا استخدام الكود التالي لتحميل وعرض ملخص لمجموعة البيانات:
#load dataset data <- ISLR::Default #view summary of dataset summary(data) default student balance income No:9667 No:7056 Min. : 0.0 Min. : 772 Yes: 333 Yes:2944 1st Qu.: 481.7 1st Qu.:21340 Median: 823.6 Median: 34553 Mean: 835.4 Mean: 33517 3rd Qu.:1166.3 3rd Qu.:43808 Max. :2654.3 Max. :73554
تحتوي مجموعة البيانات هذه على المعلومات التالية عن 10000 فرد:
- الافتراضي: يشير إلى ما إذا كان الفرد قد تخلف أم لا.
- الطالب: يشير إلى ما إذا كان الفرد طالبًا أم لا.
- الرصيد: متوسط الرصيد الذي يحمله الفرد.
- الدخل: دخل الفرد.
سوف نستخدم حالة الطالب والرصيد البنكي والدخل لبناء نموذج الانحدار اللوجستي الذي يتنبأ باحتمالية تخلف فرد معين عن السداد:
#fit logistic regression model model <- glm(default~balance+student+income, family=" binomial ", data=data) #view model summary summary(model) Call: glm(formula = default ~ balance + student + income, family = "binomial", data = data) Deviance Residuals: Min 1Q Median 3Q Max -2.4691 -0.1418 -0.0557 -0.0203 3.7383 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.087e+01 4.923e-01 -22.080 < 2e-16 *** balance 5.737e-03 2.319e-04 24.738 < 2e-16 *** studentYes -6.468e-01 2.363e-01 -2.738 0.00619 ** income 3.033e-06 8.203e-06 0.370 0.71152 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 2920.6 on 9999 degrees of freedom Residual deviance: 1571.5 on 9996 degrees of freedom AIC: 1579.5 Number of Fisher Scoring iterations: 8
يمكننا ملاحظة القيم التالية في الإخراج للصفر والانحراف المتبقي:
- الانحراف الصفري : 2920.6 مع df = 9999
- الانحراف المتبقي : 1571.5 مع df = 9996
يمكننا استخدام هذه القيم لحساب إحصائية X2 للنموذج:
- X 2 = انحراف صفر – انحراف متبقي
- X2 = 2910.6 – 1579.0
- ×2 = 1331.6
هناك p = 3 درجات حرية متغيرات التوقع.
يمكننا استخدام حاسبة Chi-square to P-value لإيجاد أن قيمة X 2 التي تبلغ 1331.6 مع 3 درجات حرية لها قيمة p تبلغ 0.000000.
وبما أن هذه القيمة الاحتمالية أقل بكثير من 0.05، فإننا نستنتج أن النموذج مفيد جدًا في التنبؤ باحتمالية تخلف فرد معين عن السداد.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ الانحدار اللوجستي عمليًا في R وPython:
كيفية إجراء الانحدار اللوجستي في R
كيفية تنفيذ الانحدار اللوجستي في بايثون