Null & residual deviance (ဥပမာများဖြင့်) အဓိပါယ်ဖွင့်နည်း
ယေဘူယျ မျဉ်းသား မော်ဒယ် ( logistic regression ၊ Poisson ဆုတ်ယုတ်မှု ၊ စသည်ဖြင့် ) နှင့် ကိုက်ညီသည့်အခါတိုင်း၊ စာရင်းအင်း ဆော့ဖ်ဝဲလ် အများစုသည် မော်ဒယ်၏ ကျန်ရှိသော သုညသွေဖည်မှု နှင့် မော်ဒယ်၏ ကျန်ရှိသော ကွဲလွဲမှုများ အတွက် တန်ဖိုးများကို ထုတ်လုပ်ပေးပါသည်။
မူရင်းအသုံးအနှုန်းတစ်ခုသာရှိသော မော်ဒယ်တစ်ခုမှ တုံ့ပြန်မှုကိန်းရှင်အား မည်မျှ ကောင်းစွာ ခန့်မှန်းနိုင်သည်ကို Zero deviance က ပြောပြသည်။
ကျန်ရှိသောသွေဖည်မှုသည် p ကိန်းရှင်ကိန်းရှင်များဖြင့် တုံ့ပြန်မှုကိန်းရှင်အား မည်မျှကောင်းစွာ ခန့်မှန်းနိုင်သည်ကို ကျွန်ုပ်တို့အား ပြောပြသည်။ တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်သည် တုံ့ပြန်မှုကိန်းရှင်၏ တန်ဖိုးကို ခန့်မှန်းနိုင်လေဖြစ်သည်။
မော်ဒယ်တစ်ခုသည် “ အသုံးဝင်သည်” ရှိမရှိ ဆုံးဖြတ်ရန် Chi-square ကိန်းဂဏန်းကို အောက်ပါအတိုင်း တွက်ချက်နိုင်ပါသည်။
X 2 = Zero deviance – ကျန်ရှိသော deviance
p ၏လွတ်လပ်မှုဒီဂရီနှင့်အတူ။
ထို့နောက် ဤ Chi-square ကိန်းဂဏန်းနှင့် ဆက်စပ်နေသည့် p-value ကို ရှာတွေ့နိုင်ပါသည်။ p-value နိမ့်လေ၊ မော်ဒယ်သည် မူရင်းအခေါ်အဝေါ်မျှသာရှိသော မော်ဒယ်တစ်ခုနှင့် နှိုင်းယှဉ်ပါက dataset ကို ပိုမိုကောင်းမွန်စွာ ဖြည့်ဆည်းနိုင်လေဖြစ်သည်။
အောက်ဖော်ပြပါ ဥပမာသည် R တွင် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံအတွက် သုညနှင့် ကျန်ရှိသော လွဲမှားမှုကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံကို ပြသထားသည်။
ဥပမာ- သုညနှင့် ကျန်ရှိသော သွေဖည်ခြင်း၏ စကားပြန်
ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် ISLR ပက်ကေ့ခ်ျမှ မူရင်း ဒေတာအတွဲကို အသုံးပြုပါမည်။ ဒေတာအတွဲ၏ အကျဉ်းချုပ်ကို တင်ရန်နှင့် ပြသရန် အောက်ပါကုဒ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။
#load dataset data <- ISLR::Default #view summary of dataset summary(data) default student balance income No:9667 No:7056 Min. : 0.0 Min. : 772 Yes: 333 Yes:2944 1st Qu.: 481.7 1st Qu.:21340 Median: 823.6 Median: 34553 Mean: 835.4 Mean: 33517 3rd Qu.:1166.3 3rd Qu.:43808 Max. :2654.3 Max. :73554
ဤဒေတာအတွဲတွင် လူ 10,000 ဦးအတွက် အောက်ပါအချက်အလက်များပါရှိသည်။
- ပုံသေ- တစ်ဦးတစ်ယောက်သည် ပုံသေသတ်မှတ်ထားခြင်း ရှိ၊ မရှိကို ဖော်ပြသည်။
- ကျောင်းသား- တစ်ဦးတစ်ယောက်သည် ကျောင်းသားဟုတ်မဟုတ် ညွှန်ပြသည်။
- လက်ကျန်- တစ်ဦးချင်းစီမှ ပျမ်းမျှလက်ကျန်ငွေ။
- ဝင်ငွေ- တစ်ဦးချင်း၏ ၀င်ငွေ။
ကျွန်ုပ်တို့သည် ကျောင်းသားအခြေအနေ၊ ဘဏ်လက်ကျန်နှင့် ၀င်ငွေကို အသုံးပြုပြီး ထောက်ပံ့ပို့ဆောင်သူတစ်ဦးသည် ပုံသေဖြစ်နိုင်ခြေကို ခန့်မှန်းပေးသည့် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို တည်ဆောက်မည်-
#fit logistic regression model model <- glm(default~balance+student+income, family=" binomial ", data=data) #view model summary summary(model) Call: glm(formula = default ~ balance + student + income, family = "binomial", data = data) Deviance Residuals: Min 1Q Median 3Q Max -2.4691 -0.1418 -0.0557 -0.0203 3.7383 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.087e+01 4.923e-01 -22.080 < 2e-16 *** balance 5.737e-03 2.319e-04 24.738 < 2e-16 *** studentYes -6.468e-01 2.363e-01 -2.738 0.00619 ** income 3.033e-06 8.203e-06 0.370 0.71152 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 2920.6 on 9999 degrees of freedom Residual deviance: 1571.5 on 9996 degrees of freedom AIC: 1579.5 Number of Fisher Scoring iterations: 8
သုညနှင့် အကြွင်းသွေဖည်မှုအတွက် အထွက်တွင် အောက်ပါတန်ဖိုးများကို ကျွန်ုပ်တို့ သတိပြုနိုင်သည်-
- Zero deviance : 2920.6 နှင့် df = 9999
- ကျန်သွေဖည် : 1571.5 နှင့် df = 9996
မော်ဒယ်၏ X 2 စာရင်းအင်းကို တွက်ချက်ရန် ဤတန်ဖိုးများကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
- X 2 = Zero deviance – ကျန်ရှိသော deviance
- X2 = 2910.6 – 1579.0
- X2 = 1331.6
p = 3 ဒီဂရီ လွတ်လပ်စွာ ခန့်မှန်းနိုင်သော ကိန်းရှင်များ ရှိပါသည်။
လွတ်လပ်မှု 3 ဒီဂရီရှိသော X 2 တန်ဖိုး 1331.6 တွင် p-value 0.000000 ရှိသည်ကို ရှာရန် Chi-square မှ P-value ဂဏန်းတွက်စက်ကို အသုံးပြုနိုင်သည်။
ဤ p-value သည် 0.05 ထက်များစွာနည်းသောကြောင့်၊ ပေးထားသောတစ်ဦးချင်းစီသည် ပုံသေဖြစ်နိုင်ခြေကို ခန့်မှန်းရာတွင် မော်ဒယ်သည် အလွန်အသုံးဝင်ကြောင်း ကျွန်ုပ်တို့ကောက်ချက်ချပါမည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R နှင့် Python တွင် လက်တွေ့တွင် logistic regression လုပ်ဆောင်ပုံကို ရှင်းပြသည်-
R တွင် logistic regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း
Python တွင် Logistic Regression ကို မည်သို့လုပ်ဆောင်မည်နည်း။