كيفية تفسير الانحراف الفارغ والمتبقي (مع أمثلة)


عندما تناسب نموذجًا خطيًا عامًا (مثل الانحدار اللوجستي، وانحدار بواسون، وما إلى ذلك)، تنتج معظم البرامج الإحصائية قيمًا للانحراف الصفري والانحراف المتبقي للنموذج.

يخبرنا الانحراف الصفري بمدى إمكانية التنبؤ بمتغير الاستجابة من خلال نموذج يحتوي على مصطلح أصلي فقط.

يخبرنا الانحراف المتبقي عن مدى إمكانية التنبؤ بمتغير الاستجابة من خلال نموذج يحتوي على متغيرات توقعية . كلما انخفضت القيمة، كانت قدرة النموذج على التنبؤ بقيمة متغير الاستجابة أفضل.

لتحديد ما إذا كان النموذج “مفيدًا”، يمكننا حساب إحصائية مربع كاي كما يلي:

X 2 = انحراف صفر – انحراف متبقي

مع درجات الحرية.

يمكننا بعد ذلك إيجاد القيمة الاحتمالية المرتبطة بإحصائيات مربع كاي. كلما انخفضت القيمة الاحتمالية، كانت قدرة النموذج على ملاءمة مجموعة البيانات أفضل مقارنة بالنموذج الذي يحتوي على مصطلح أصلي فقط.

يوضح المثال التالي كيفية تفسير الانحراف الصفري والمتبقي لنموذج الانحدار اللوجستي في R.

مثال: تفسير الصفر والانحراف المتبقي

في هذا المثال، سوف نستخدم مجموعة البيانات الافتراضية من حزمة ISLR. يمكننا استخدام الكود التالي لتحميل وعرض ملخص لمجموعة البيانات:

 #load dataset
data <- ISLR::Default

#view summary of dataset
summary(data)

 default student balance income     
 No:9667 No:7056 Min. : 0.0 Min. : 772  
 Yes: 333 Yes:2944 1st Qu.: 481.7 1st Qu.:21340  
                       Median: 823.6 Median: 34553  
                       Mean: 835.4 Mean: 33517  
                       3rd Qu.:1166.3 3rd Qu.:43808  
                       Max. :2654.3 Max. :73554 

تحتوي مجموعة البيانات هذه على المعلومات التالية عن 10000 فرد:

  • الافتراضي: يشير إلى ما إذا كان الفرد قد تخلف أم لا.
  • الطالب: يشير إلى ما إذا كان الفرد طالبًا أم لا.
  • الرصيد: متوسط الرصيد الذي يحمله الفرد.
  • الدخل: دخل الفرد.

سوف نستخدم حالة الطالب والرصيد البنكي والدخل لبناء نموذج الانحدار اللوجستي الذي يتنبأ باحتمالية تخلف فرد معين عن السداد:

 #fit logistic regression model
model <- glm(default~balance+student+income, family=" binomial ", data=data)

#view model summary
summary(model)

Call:
glm(formula = default ~ balance + student + income, family = "binomial", 
    data = data)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-2.4691 -0.1418 -0.0557 -0.0203 3.7383  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -1.087e+01 4.923e-01 -22.080 < 2e-16 ***
balance 5.737e-03 2.319e-04 24.738 < 2e-16 ***
studentYes -6.468e-01 2.363e-01 -2.738 0.00619 ** 
income 3.033e-06 8.203e-06 0.370 0.71152    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2920.6 on 9999 degrees of freedom
Residual deviance: 1571.5 on 9996 degrees of freedom
AIC: 1579.5

Number of Fisher Scoring iterations: 8

يمكننا ملاحظة القيم التالية في الإخراج للصفر والانحراف المتبقي:

  • الانحراف الصفري : 2920.6 مع df = 9999
  • الانحراف المتبقي : 1571.5 مع df = 9996

يمكننا استخدام هذه القيم لحساب إحصائية X2 للنموذج:

  • X 2 = انحراف صفر – انحراف متبقي
  • X2 = 2910.6 – 1579.0
  • ×2 = 1331.6

هناك p = 3 درجات حرية متغيرات التوقع.

يمكننا استخدام حاسبة Chi-square to P-value لإيجاد أن قيمة X 2 التي تبلغ 1331.6 مع 3 درجات حرية لها قيمة p تبلغ 0.000000.

وبما أن هذه القيمة الاحتمالية أقل بكثير من 0.05، فإننا نستنتج أن النموذج مفيد جدًا في التنبؤ باحتمالية تخلف فرد معين عن السداد.

مصادر إضافية

تشرح البرامج التعليمية التالية كيفية تنفيذ الانحدار اللوجستي عمليًا في R وPython:

كيفية إجراء الانحدار اللوجستي في R
كيفية تنفيذ الانحدار اللوجستي في بايثون

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *