Null & residual deviance (ဥပမာများဖြင့်) အဓိပါယ်ဖွင့်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 23, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ယေဘူယျ မျဉ်းသား မော်ဒယ် ( logistic regression ၊ Poisson ဆုတ်ယုတ်မှု ၊ စသည်ဖြင့် ) နှင့် ကိုက်ညီသည့်အခါတိုင်း၊ စာရင်းအင်း ဆော့ဖ်ဝဲလ် အများစုသည် မော်ဒယ်၏ ကျန်ရှိသော သုညသွေဖည်မှု နှင့် မော်ဒယ်၏ ကျန်ရှိသော ကွဲလွဲမှုများ အတွက် တန်ဖိုးများကို ထုတ်လုပ်ပေးပါသည်။

မူရင်းအသုံးအနှုန်းတစ်ခုသာရှိသော မော်ဒယ်တစ်ခုမှ တုံ့ပြန်မှုကိန်းရှင်အား မည်မျှ ကောင်းစွာ ခန့်မှန်းနိုင်သည်ကို Zero deviance က ပြောပြသည်။

ကျန်ရှိသောသွေဖည်မှုသည် p ကိန်းရှင်ကိန်းရှင်များဖြင့် တုံ့ပြန်မှုကိန်းရှင်အား မည်မျှကောင်းစွာ ခန့်မှန်းနိုင်သည်ကို ကျွန်ုပ်တို့အား ပြောပြသည်။ တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်သည် တုံ့ပြန်မှုကိန်းရှင်၏ တန်ဖိုးကို ခန့်မှန်းနိုင်လေဖြစ်သည်။

မော်ဒယ်တစ်ခုသည် “ အသုံးဝင်သည်” ရှိမရှိ ဆုံးဖြတ်ရန် Chi-square ကိန်းဂဏန်းကို အောက်ပါအတိုင်း တွက်ချက်နိုင်ပါသည်။

X ² = Zero deviance – ကျန်ရှိသော deviance

p ၏လွတ်လပ်မှုဒီဂရီနှင့်အတူ။

ထို့နောက် ဤ Chi-square ကိန်းဂဏန်းနှင့် ဆက်စပ်နေသည့် p-value ကို ရှာတွေ့နိုင်ပါသည်။ p-value နိမ့်လေ၊ မော်ဒယ်သည် မူရင်းအခေါ်အဝေါ်မျှသာရှိသော မော်ဒယ်တစ်ခုနှင့် နှိုင်းယှဉ်ပါက dataset ကို ပိုမိုကောင်းမွန်စွာ ဖြည့်ဆည်းနိုင်လေဖြစ်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် R တွင် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံအတွက် သုညနှင့် ကျန်ရှိသော လွဲမှားမှုကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံကို ပြသထားသည်။

ဥပမာ- သုညနှင့် ကျန်ရှိသော သွေဖည်ခြင်း၏ စကားပြန်

ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် ISLR ပက်ကေ့ခ်ျမှ မူရင်း ဒေတာအတွဲကို အသုံးပြုပါမည်။ ဒေတာအတွဲ၏ အကျဉ်းချုပ်ကို တင်ရန်နှင့် ပြသရန် အောက်ပါကုဒ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။

 #load dataset
data <- ISLR::Default

#view summary of dataset
summary(data)

 default student balance income     
 No:9667 No:7056 Min. : 0.0 Min. : 772  
 Yes: 333 Yes:2944 1st Qu.: 481.7 1st Qu.:21340  
                       Median: 823.6 Median: 34553  
                       Mean: 835.4 Mean: 33517  
                       3rd Qu.:1166.3 3rd Qu.:43808  
                       Max. :2654.3 Max. :73554

ဤဒေတာအတွဲတွင် လူ 10,000 ဦးအတွက် အောက်ပါအချက်အလက်များပါရှိသည်။

ပုံသေ- တစ်ဦးတစ်ယောက်သည် ပုံသေသတ်မှတ်ထားခြင်း ရှိ၊ မရှိကို ဖော်ပြသည်။
ကျောင်းသား- တစ်ဦးတစ်ယောက်သည် ကျောင်းသားဟုတ်မဟုတ် ညွှန်ပြသည်။
လက်ကျန်- တစ်ဦးချင်းစီမှ ပျမ်းမျှလက်ကျန်ငွေ။
ဝင်ငွေ- တစ်ဦးချင်း၏ ၀င်ငွေ။

ကျွန်ုပ်တို့သည် ကျောင်းသားအခြေအနေ၊ ဘဏ်လက်ကျန်နှင့် ၀င်ငွေကို အသုံးပြုပြီး ထောက်ပံ့ပို့ဆောင်သူတစ်ဦးသည် ပုံသေဖြစ်နိုင်ခြေကို ခန့်မှန်းပေးသည့် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို တည်ဆောက်မည်-

 #fit logistic regression model
model <- glm(default~balance+student+income, family=" binomial ", data=data)

#view model summary
summary(model)

Call:
glm(formula = default ~ balance + student + income, family = "binomial", 
    data = data)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-2.4691 -0.1418 -0.0557 -0.0203 3.7383  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -1.087e+01 4.923e-01 -22.080 < 2e-16 ***
balance 5.737e-03 2.319e-04 24.738 < 2e-16 ***
studentYes -6.468e-01 2.363e-01 -2.738 0.00619 ** 
income 3.033e-06 8.203e-06 0.370 0.71152    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2920.6 on 9999 degrees of freedom
Residual deviance: 1571.5 on 9996 degrees of freedom
AIC: 1579.5

Number of Fisher Scoring iterations: 8

သုညနှင့် အကြွင်းသွေဖည်မှုအတွက် အထွက်တွင် အောက်ပါတန်ဖိုးများကို ကျွန်ုပ်တို့ သတိပြုနိုင်သည်-

Zero deviance : 2920.6 နှင့် df = 9999
ကျန်သွေဖည် : 1571.5 နှင့် df = 9996

မော်ဒယ်၏ X ² စာရင်းအင်းကို တွက်ချက်ရန် ဤတန်ဖိုးများကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

X ² = Zero deviance – ကျန်ရှိသော deviance
^X2 = 2910.6 – 1579.0
^X2 = 1331.6

p = 3 ဒီဂရီ လွတ်လပ်စွာ ခန့်မှန်းနိုင်သော ကိန်းရှင်များ ရှိပါသည်။

လွတ်လပ်မှု 3 ဒီဂရီရှိသော X ² တန်ဖိုး 1331.6 တွင် p-value 0.000000 ရှိသည်ကို ရှာရန် Chi-square မှ P-value ဂဏန်းတွက်စက်ကို အသုံးပြုနိုင်သည်။

ဤ p-value သည် 0.05 ထက်များစွာနည်းသောကြောင့်၊ ပေးထားသောတစ်ဦးချင်းစီသည် ပုံသေဖြစ်နိုင်ခြေကို ခန့်မှန်းရာတွင် မော်ဒယ်သည် အလွန်အသုံးဝင်ကြောင်း ကျွန်ုပ်တို့ကောက်ချက်ချပါမည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R နှင့် Python တွင် လက်တွေ့တွင် logistic regression လုပ်ဆောင်ပုံကို ရှင်းပြသည်-

R တွင် logistic regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း
Python တွင် Logistic Regression ကို မည်သို့လုပ်ဆောင်မည်နည်း။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

ဥပမာ- သုညနှင့် ကျန်ရှိသော သွေဖည်ခြင်း၏ စကားပြန်

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။