R တွင် မည်ကဲ့သို့ ပြင်ဆင်ရမည်နည်း။


R တွင် သင်ကြုံတွေ့ရနိုင်သော အမှားအယွင်း မက်ဆေ့ချ်သည်-

 Coefficients: (1 not defined because of singularities) 

R တွင် glm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ မော်ဒယ်တစ်ခုနှင့် အံဝင်ခွင်ကျဖြစ်ချိန်တွင် သင့်ခန့်မှန်းပေးသူ ကိန်းရှင်နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော တစ်ခုနှင့်တစ်ခု တိကျသော linear ဆက်နွယ်မှုရှိသည် — perfect multicollinearity ဟုခေါ်သည်။

ဤအမှားကို ပြင်ဆင်ရန်၊ တစ်ခုနှင့်တစ်ခု ပြီးပြည့်စုံသော ဆက်နွယ်မှုရှိသော သင့်ဒေတာအတွဲရှိ ကိန်းရှင်များကို ခွဲခြားသတ်မှတ်ရန် cor() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပြီး ဤကိန်းရှင်များထဲမှ တစ်ခုကို ဆုတ်ယုတ်မှုပုံစံမှ ဖယ်ရှားလိုက်ပါ။

ဤသင်ခန်းစာတွင် ဤအမှားအယွင်းမက်ဆေ့ခ်ျကို လက်တွေ့တွင် မည်သို့ကိုင်တွယ်ဖြေရှင်းရမည်ကို ရှင်းပြထားသည်။

အမှားကို ဘယ်လိုပြန်ထုတ်မလဲ။

ကျွန်ုပ်တို့သည် R ရှိ အောက်ပါဒေတာဘောင်တွင် ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို တပ်ဆင်ထားသည်ဆိုပါစို့။

 #define data
df <- data. frame (y = c(0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1),
                 x1 = c(3, 3, 4, 4, 3, 2, 5, 8, 9, 9, 9, 8, 9, 9, 9),
                 x2 = c(6, 6, 8, 8, 6, 4, 10, 16, 18, 18, 18, 16, 18, 18, 18),
                 x3 = c(4, 7, 7, 3, 8, 9, 9, 8, 7, 8, 9, 4, 9, 10, 13))

#fit logistic regression model
model <- glm(y~x1+x2+x3, data=df, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = y ~ x1 + x2 + x3, family = binomial, data = df)

Deviance Residuals: 
       Min 1Q Median 3Q Max  
-1.372e-05 -2.110e-08 2.110e-08 2.110e-08 1.575e-05  

Coefficients: (1 not defined because of singularities)
              Estimate Std. Error z value Pr(>|z|)
(Intercept) -75.496 176487.031 0.000 1
x1 14.546 24314.459 0.001 1
x2 NA NA NA NA
x3 -2.258 20119.863 0.000 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2.0728e+01 on 14 degrees of freedom
Residual deviance: 5.1523e-10 on 12 degrees of freedom
AIC: 6

Number of Fisher Scoring iterations: 24

coefficient output မထွက်မီလေးမှာ မက်ဆေ့ချ်ကို လက်ခံရရှိကြောင်း သတိပြုပါ။

 Coefficients: (1 not defined because of singularities)

၎င်းသည် မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းကိန်းရှင် နှစ်ခု သို့မဟုတ် ထိုထက်ပိုသော ကိန်းရှင်များသည် ပြီးပြည့်စုံသော linear ဆက်နွယ်မှုရှိပြီး ထို့ကြောင့် မော်ဒယ်ရှိ ဆုတ်ယုတ်မှုကိန်းဂဏန်းအားလုံးကို ခန့်မှန်း၍မရနိုင်ကြောင်း ဖော်ပြသည်။

ဥပမာအားဖြင့်၊ ခန့်မှန်းသူ variable x 2 အတွက် ကိန်းဂဏန်း ခန့်မှန်းချက်များကို မပြုလုပ်နိုင်ကြောင်း သတိပြုပါ။

အမှားကို ဘယ်လို ကိုင်တွယ်မလဲ။

ဤအမှားကို ဖြစ်စေသော ခန့်မှန်းသူ ကိန်းရှင်များကို ခွဲခြားသတ်မှတ်ရန်၊ ကျွန်ုပ်တို့သည် ဆက်စပ်မက်ထရစ်ကို ထုတ်လုပ်ရန် cor() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပြီး တစ်ခုနှင့်တစ်ခု အတိအကျ 1 ဆက်စပ်မှုရှိသည့် ကိန်းရှင်များကို စစ်ဆေးကြည့်ရှုနိုင်သည်-

 #create correlation matrix
cor(df)

           y x1 x2 x3
y 1.0000000 0.9675325 0.9675325 0.3610320
x1 0.9675325 1.0000000 1.0000000 0.3872889
x2 0.9675325 1.0000000 1.0000000 0.3872889
x3 0.3610320 0.3872889 0.3872889 1.0000000

ဆက်စပ် matrix မှ၊ variables x 1 နှင့် x 2 တို့သည် လုံးဝဆက်စပ်နေကြောင်း ကျွန်ုပ်တို့တွေ့နိုင်ပါသည်။

ဤအမှားကိုဖြေရှင်းရန်၊ ၎င်းတို့သည် ဆုတ်ယုတ်မှုပုံစံတွင် အမှန်တကယ်ထူးခြားသော သို့မဟုတ် အမှီအခိုကင်းသောအချက်အလက်များကို အမှန်တကယ်မပေးသည့်အတွက်ကြောင့် ဤကိန်းရှင်နှစ်ခုထဲမှတစ်ခုကို ကျွန်ုပ်တို့ ရိုးရှင်းစွာဖယ်ရှားနိုင်ပါသည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် x 2 ကို ဖယ်ရှားပြီး အောက်ပါ logistic regression model ကို ကိုက်ညီသည်ဆိုပါစို့။

 #fit logistic regression model
model <- glm(y~x1+x3, data=df, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = y ~ x1 + x3, family = binomial, data = df)

Deviance Residuals: 
       Min 1Q Median 3Q Max  
-1.372e-05 -2.110e-08 2.110e-08 2.110e-08 1.575e-05  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept) -75.496 176487.031 0.000 1
x1 14.546 24314.459 0.001 1
x3 -2.258 20119.863 0.000 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2.0728e+01 on 14 degrees of freedom
Residual deviance: 5.1523e-10 on 12 degrees of freedom
AIC: 6

Number of Fisher Scoring iterations: 24

ဤတစ်ကြိမ်တွင် ကျွန်ုပ်တို့သည် “ သတ်မှတ်မထားသော အနည်းကိန်းများကြောင့်” အမှားမက်ဆေ့ချ်ကို လက်ခံရရှိခြင်းမရှိကြောင်း သတိပြုပါ။

မှတ်ချက် – x 1 သို့မဟုတ် x 2 ကို ဖယ်ရှားသည်ဖြစ်စေ အရေးမကြီးပါ။ နောက်ဆုံးမော်ဒယ်တွင် သင်သိမ်းထားရန် ဆုံးဖြတ်ထားသော ကိန်းရှင်အတွက် တူညီသောကိန်းဂဏန်းခန့်မှန်းချက် ပါဝင်မည်ဖြစ်ပြီး မော်ဒယ်၏ အံဝင်ခွင်ကျ အလုံးစုံကောင်းမွန်မှုသည် အတူတူပင်ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားအမှားများကို ကိုင်တွယ်နည်းကို ရှင်းပြသည်-

R တွင် ပြင်ဆင်နည်း- ExtractVars ရှိ မမှန်ကန်သော နမူနာပုံစံဖော်မြူလာ
R- argument သည် ကိန်းဂဏာန်းမဟုတ်သလို ယုတ္တိလည်းမဟုတ်- return na
ပြင်ဆင်နည်း- randomForest.default(m, y, …): နိုင်ငံခြား လုပ်ဆောင်ချက်ခေါ်ဆိုမှုတွင် Na/NaN/Inf

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်