Null & residual deviance (ဥပမာများဖြင့်) အဓိပါယ်ဖွင့်နည်း


ယေဘူယျ မျဉ်းသား မော်ဒယ် ( logistic regression ၊ Poisson ဆုတ်ယုတ်မှု ၊ စသည်ဖြင့် ) နှင့် ကိုက်ညီသည့်အခါတိုင်း၊ စာရင်းအင်း ဆော့ဖ်ဝဲလ် အများစုသည် မော်ဒယ်၏ ကျန်ရှိသော သုညသွေဖည်မှု နှင့် မော်ဒယ်၏ ကျန်ရှိသော ကွဲလွဲမှုများ အတွက် တန်ဖိုးများကို ထုတ်လုပ်ပေးပါသည်။

မူရင်းအသုံးအနှုန်းတစ်ခုသာရှိသော မော်ဒယ်တစ်ခုမှ တုံ့ပြန်မှုကိန်းရှင်အား မည်မျှ ကောင်းစွာ ခန့်မှန်းနိုင်သည်ကို Zero deviance က ပြောပြသည်။

ကျန်ရှိသောသွေဖည်မှုသည် p ကိန်းရှင်ကိန်းရှင်များဖြင့် တုံ့ပြန်မှုကိန်းရှင်အား မည်မျှကောင်းစွာ ခန့်မှန်းနိုင်သည်ကို ကျွန်ုပ်တို့အား ပြောပြသည်။ တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်သည် တုံ့ပြန်မှုကိန်းရှင်၏ တန်ဖိုးကို ခန့်မှန်းနိုင်လေဖြစ်သည်။

မော်ဒယ်တစ်ခုသည် “ အသုံးဝင်သည်” ရှိမရှိ ဆုံးဖြတ်ရန် Chi-square ကိန်းဂဏန်းကို အောက်ပါအတိုင်း တွက်ချက်နိုင်ပါသည်။

X 2 = Zero deviance – ကျန်ရှိသော deviance

p ၏လွတ်လပ်မှုဒီဂရီနှင့်အတူ။

ထို့နောက် ဤ Chi-square ကိန်းဂဏန်းနှင့် ဆက်စပ်နေသည့် p-value ကို ရှာတွေ့နိုင်ပါသည်။ p-value နိမ့်လေ၊ မော်ဒယ်သည် မူရင်းအခေါ်အဝေါ်မျှသာရှိသော မော်ဒယ်တစ်ခုနှင့် နှိုင်းယှဉ်ပါက dataset ကို ပိုမိုကောင်းမွန်စွာ ဖြည့်ဆည်းနိုင်လေဖြစ်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် R တွင် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံအတွက် သုညနှင့် ကျန်ရှိသော လွဲမှားမှုကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံကို ပြသထားသည်။

ဥပမာ- သုညနှင့် ကျန်ရှိသော သွေဖည်ခြင်း၏ စကားပြန်

ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် ISLR ပက်ကေ့ခ်ျမှ မူရင်း ဒေတာအတွဲကို အသုံးပြုပါမည်။ ဒေတာအတွဲ၏ အကျဉ်းချုပ်ကို တင်ရန်နှင့် ပြသရန် အောက်ပါကုဒ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။

 #load dataset
data <- ISLR::Default

#view summary of dataset
summary(data)

 default student balance income     
 No:9667 No:7056 Min. : 0.0 Min. : 772  
 Yes: 333 Yes:2944 1st Qu.: 481.7 1st Qu.:21340  
                       Median: 823.6 Median: 34553  
                       Mean: 835.4 Mean: 33517  
                       3rd Qu.:1166.3 3rd Qu.:43808  
                       Max. :2654.3 Max. :73554 

ဤဒေတာအတွဲတွင် လူ 10,000 ဦးအတွက် အောက်ပါအချက်အလက်များပါရှိသည်။

  • ပုံသေ- တစ်ဦးတစ်ယောက်သည် ပုံသေသတ်မှတ်ထားခြင်း ရှိ၊ မရှိကို ဖော်ပြသည်။
  • ကျောင်းသား- တစ်ဦးတစ်ယောက်သည် ကျောင်းသားဟုတ်မဟုတ် ညွှန်ပြသည်။
  • လက်ကျန်- တစ်ဦးချင်းစီမှ ပျမ်းမျှလက်ကျန်ငွေ။
  • ဝင်ငွေ- တစ်ဦးချင်း၏ ၀င်ငွေ။

ကျွန်ုပ်တို့သည် ကျောင်းသားအခြေအနေ၊ ဘဏ်လက်ကျန်နှင့် ၀င်ငွေကို အသုံးပြုပြီး ထောက်ပံ့ပို့ဆောင်သူတစ်ဦးသည် ပုံသေဖြစ်နိုင်ခြေကို ခန့်မှန်းပေးသည့် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို တည်ဆောက်မည်-

 #fit logistic regression model
model <- glm(default~balance+student+income, family=" binomial ", data=data)

#view model summary
summary(model)

Call:
glm(formula = default ~ balance + student + income, family = "binomial", 
    data = data)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-2.4691 -0.1418 -0.0557 -0.0203 3.7383  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -1.087e+01 4.923e-01 -22.080 < 2e-16 ***
balance 5.737e-03 2.319e-04 24.738 < 2e-16 ***
studentYes -6.468e-01 2.363e-01 -2.738 0.00619 ** 
income 3.033e-06 8.203e-06 0.370 0.71152    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2920.6 on 9999 degrees of freedom
Residual deviance: 1571.5 on 9996 degrees of freedom
AIC: 1579.5

Number of Fisher Scoring iterations: 8

သုညနှင့် အကြွင်းသွေဖည်မှုအတွက် အထွက်တွင် အောက်ပါတန်ဖိုးများကို ကျွန်ုပ်တို့ သတိပြုနိုင်သည်-

  • Zero deviance : 2920.6 နှင့် df = 9999
  • ကျန်သွေဖည် : 1571.5 နှင့် df = 9996

မော်ဒယ်၏ X 2 စာရင်းအင်းကို တွက်ချက်ရန် ဤတန်ဖိုးများကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

  • X 2 = Zero deviance – ကျန်ရှိသော deviance
  • X2 = 2910.6 – 1579.0
  • X2 = 1331.6

p = 3 ဒီဂရီ လွတ်လပ်စွာ ခန့်မှန်းနိုင်သော ကိန်းရှင်များ ရှိပါသည်။

လွတ်လပ်မှု 3 ဒီဂရီရှိသော X 2 တန်ဖိုး 1331.6 တွင် p-value 0.000000 ရှိသည်ကို ရှာရန် Chi-square မှ P-value ဂဏန်းတွက်စက်ကို အသုံးပြုနိုင်သည်။

ဤ p-value သည် 0.05 ထက်များစွာနည်းသောကြောင့်၊ ပေးထားသောတစ်ဦးချင်းစီသည် ပုံသေဖြစ်နိုင်ခြေကို ခန့်မှန်းရာတွင် မော်ဒယ်သည် အလွန်အသုံးဝင်ကြောင်း ကျွန်ုပ်တို့ကောက်ချက်ချပါမည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R နှင့် Python တွင် လက်တွေ့တွင် logistic regression လုပ်ဆောင်ပုံကို ရှင်းပြသည်-

R တွင် logistic regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း
Python တွင် Logistic Regression ကို မည်သို့လုပ်ဆောင်မည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်