ကိုင်တွယ်နည်း- glm.fit- ဂဏန်းများဖြင့် ချိန်ညှိထားသော ဖြစ်နိုင်ခြေ 0 သို့မဟုတ် 1 ဖြစ်ပေါ်သည်။


R တွင် သင်တွေ့နိုင်သောသတိပေးစာမှာ-

 Warning message:
glm.fit: fitted probabilities numerically 0 or 1 occurred 

သင်သည် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို အံဝင်ခွင်ကျဖြစ်စေသောအခါတွင် ဤသတိပေးချက်သည် သင့်ဒေတာဘေ့စ်ရှိ တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော စူးစမ်းလေ့လာမှုများ၏ ဖြစ်နိုင်ခြေများကို 0 သို့မဟုတ် 1 နှင့် ခွဲခြား၍မရပါ။

ဤသည်မှာ သတိပေးစာ ဖြစ်ပြီး အမှားအယွင်းမဟုတ်ကြောင်း သတိပြုပါ။ ဤအမှားကို သင်လက်ခံရရှိလျှင်ပင်၊ သင်၏ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် အံဝင်ခွင်ကျဖြစ်နေဆဲဖြစ်သည်၊ သို့သော် ဤသတိပေးစာအား ပေါ်လာစေသည့် အစွန်းအထင်းများ ရှိမရှိ သိရှိနိုင်ရန် မူရင်းဒေတာဘောင်ကို ပိုင်းခြားစိတ်ဖြာရန် အထောက်အကူဖြစ်နိုင်ပါသည်။

ဤသင်ခန်းစာတွင် ဤသတိပေးစာကို လက်တွေ့တွင် မည်သို့ကိုင်တွယ်ရမည်ကို ရှင်းပြထားသည်။

သတိပေးချက်ကို ဘယ်လိုမျိုးပွားမလဲ။

ကျွန်ုပ်တို့သည် R ရှိ အောက်ပါဒေတာဘောင်တွင် ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို တပ်ဆင်ထားသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (y = c(0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1),
                 x1 = c(3, 3, 4, 4, 3, 2, 5, 8, 9, 9, 9, 8, 9, 9, 9),
                 x2 = c(8, 7, 7, 6, 5, 6, 5, 2, 2, 3, 4, 3, 7, 4, 4))

#fit logistic regression model
model <- glm(y ~ x1 + x2, data=df, family=binomial)

#view model summary
summary(model)

Warning message:
glm.fit: fitted probabilities numerically 0 or 1 occurred 

Call:
glm(formula = y ~ x1 + x2, family = binomial, data = df)

Deviance Residuals: 
       Min 1Q Median 3Q Max  
-1.729e-05 -2.110e-08 2.110e-08 2.110e-08 1.515e-05  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept) -75.205 307338.933 0 1
x1 13,309 28512,818 0 1
x2 -2.793 37342.280 0 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2.0728e+01 on 14 degrees of freedom
Residual deviance: 5.6951e-10 on 12 degrees of freedom
AIC: 6

Number of Fisher Scoring iterations: 24

ကျွန်ုပ်တို့၏ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာနှင့် အံဝင်ခွင်ကျဖြစ်နိုင်သော်လည်း ဖြစ်နိုင်ခြေများကို 0 သို့မဟုတ် 1 သို့ ကိန်းဂဏန်းများဖြင့် ချိန်ညှိပေးသည့် သတိပေးမက်ဆေ့ချ်ကို ကျွန်ုပ်တို့ လက်ခံရရှိပါသည်။

မူလဒေတာဘေ့စ်ရှိ မှတ်သားမှုများ၏ တုံ့ပြန်မှုတန်ဖိုးနှင့်ပတ်သက်၍ ခန့်မှန်းချက်များပြုလုပ်ရန် တပ်ဆင်ထားသော ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံကို အသုံးပြုပါက၊ ခန့်မှန်းခြေဖြစ်နိုင်ခြေအားလုံးနီးပါးသည် 0 နှင့် 1 တို့မှ ခွဲခြား၍မရသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

 #use fitted model to predict response values
df$y_pred = predict(model, df, type=" response ")

#view updated data frame
df

   y x1 x2 y_pred
1 0 3 8 2.220446e-16
2 0 3 7 2.220446e-16
3 0 4 7 2.220446e-16
4 0 4 6 2.220446e-16
5 0 3 5 2.220446e-16
6 0 2 6 2.220446e-16
7 0 5 5 1.494599e-10
8 1 8 2 1.000000e+00
9 1 9 2 1.000000e+00
10 1 9 3 1.000000e+00
11 1 9 4 1.000000e+00
12 1 8 3 1.000000e+00
13 1 9 7 1.000000e+00
14 1 9 4 1.000000e+00
15 1 9 4 1.000000e+00

သတိပေးချက်ကို ဘယ်လိုကိုင်တွယ်မလဲ။

ဤသတိပေးစာကို ကိုင်တွယ်ရန် နည်းလမ်းသုံးမျိုးရှိသည်။

(၁) လျစ်လျူရှုပါ။

အချို့သောကိစ္စများတွင်၊ ဤသတိပေးစာသည် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံတွင် ပြဿနာရှိနေကြောင်း သေချာပေါက်မညွှန်ပြသောကြောင့် သင်သည် ဤသတိပေးစာကို ရိုးရှင်းစွာ လျစ်လျူရှုနိုင်သည်။ ဆိုလိုသည်မှာ ဒေတာဘောင်ရှိ တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော လေ့လာတွေ့ရှိချက်များသည် 0 သို့မဟုတ် 1 မှ ခွဲခြား၍မရသော ခန့်မှန်းတန်ဖိုးများရှိသည်။

(၂) နမူနာအရွယ်အစားကို တိုးပေးပါ။

အခြားကိစ္စများတွင်၊ ယုံကြည်စိတ်ချရသော မော်ဒယ်အံကိုက်ကို ပေးဆောင်ရန် ဒေတာအလုံအလောက်မရှိသော ဒေတာအတုံးငယ်များဖြင့် လုပ်ဆောင်သောအခါတွင် ဤသတိပေးစာ ပေါ်လာပါသည်။ ဤအမှားကိုပြင်ရန်၊ မော်ဒယ်တွင် သင်ထည့်သွင်းထားသော လေ့လာတွေ့ရှိချက်များ၏နမူနာအရွယ်အစားကို ရိုးရှင်းစွာ တိုးမြှင့်ပါ။

(၃) အစွန်းအထင်းများကို ဖယ်ရှားပါ။

အခြားကိစ္စများတွင်၊ မူရင်းဒေတာဘေ့စ်တွင် အစွန်းအထင်းများရှိနေသောအခါတွင် ဤအမှားသည် 0 သို့မဟုတ် 1 အနီးတွင် ဖြစ်နိုင်ခြေအနည်းငယ်သာရှိသည်၊ ဤအကွာအဝေးများကို ဖယ်ရှားခြင်းဖြင့်၊ သတိပေးချက်သည် မကြာခဏဆိုသလို ပျောက်သွားပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် အခြားသတိပေးချက်များနှင့် အမှားအယွင်းများကို ကိုင်တွယ်နည်းကို အောက်ပါသင်ခန်းစာများက ရှင်းပြသည်-

R တွင် ပြင်ဆင်နည်း- ExtractVars ရှိ မမှန်ကန်သော နမူနာပုံစံဖော်မြူလာ
R- argument သည် ကိန်းဂဏာန်းမဟုတ်သလို ယုတ္တိလည်းမဟုတ်- return na
ပြင်ဆင်နည်း- randomForest.default(m, y, …): နိုင်ငံခြား လုပ်ဆောင်ချက်ခေါ်ဆိုမှုတွင် Na/NaN/Inf

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်