R တွင် glm ဖြင့် ခန့်မှန်းသည့်လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း (ဥပမာများနှင့်အတူ)


R ရှိ glm() လုပ်ဆောင်ချက်ကို ယေဘူယျအားဖြင့် မျဉ်းသားထားသော မော်ဒယ်များနှင့် ကိုက်ညီရန် အသုံးပြုနိုင်သည်။ ဤအင်္ဂါရပ်သည် ထောက်ပံ့ ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံများPoisson ဆုတ်ယုတ်မှုပုံစံများ နှင့် အခြားရှုပ်ထွေးသော မော်ဒယ်များအတွက် သင့်လျော်သည်။

ကျွန်ုပ်တို့သည် မော်ဒယ်တစ်ခုကို တပ်ဆင်ပြီးသည်နှင့်၊ ကျွန်ုပ်တို့သည် လေ့လာမှုအသစ်တစ်ခု၏ တုံ့ပြန်မှုတန်ဖိုးကို ခန့်မှန်းရန် ကြိုတင်ခန့်မှန်း() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-

ခန့်မှန်းချက်(အရာဝတ္ထု၊ ဒေတာအသစ်၊ အမျိုးအစား = “ တုံ့ပြန်မှု” )

ရွှေ-

  • အရာဝတ္ထု- glm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ မော်ဒယ် ချိန်ညှိမှုအမည်
  • newdata- ခန့် မှန်းချက်ပြုလုပ်ရန် ဒေတာဘောင်အသစ်၏ အမည်
  • အမျိုးအစား- ခန့်မှန်းချက် အမျိုးအစား။

အောက်ဖော်ပြပါ ဥပမာသည် R တွင် ယေဘူယျအားဖြင့် မျဉ်းသားပုံစံကို မည်သို့ အံဝင်ခွင်ကျလုပ်ရမည်နှင့် ယခင်က မမြင်ဖူးသော စူးစမ်းမှုအသစ်၏ တုံ့ပြန်မှုတန်ဖိုးကို ခန့်မှန်းရန် မော်ဒယ်ကို မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- R တွင် glm ဖြင့် ခန့်မှန်းချက်လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်း။

ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် mtcars ဟုခေါ်သော built-in R ဒေတာအတွဲကို အသုံးပြုပါမည်။

 #view first six rows of mtcars data frame
head(mtcars)

                   mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုပြောင်းလဲနိုင်သော am (ကား၏ဂီယာအမျိုးအစား- 0 = အလိုအလျောက်၊ 1 = manual) ကို ခန့်မှန်းရန် ကျွန်ုပ်တို့အသုံးပြုသည့် variables disp နှင့် hp တို့ကို အသုံးပြုထားသည့် အောက်ပါ logistic regression model နှင့် ကိုက်ညီပါမည်။

 #fit logistic regression model
model <- glm(am ~ disp + hp, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + hp, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.9665 -0.3090 -0.0017 0.3934 1.3682  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)  
(Intercept) 1.40342 1.36757 1.026 0.3048  
available -0.09518 0.04800 -1.983 0.0474 *
hp 0.12170 0.06777 1.796 0.0725 .
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 16,713 on 29 degrees of freedom
AIC: 22,713

Number of Fisher Scoring iterations: 8

ကားအသစ်တွင် အော်တိုဂီယာ (am=0) သို့မဟုတ် manual ဂီယာ (am=1) အောက်ဖော်ပြပါကုဒ်ကို အသုံးပြု၍ ဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် ဤမော်ဒယ်ကို အသုံးပြုနိုင်ပါသည်။

 #define new observation
newdata = data. frame (disp=200, hp=100)

#use model to predict value of am
predict(model, newdata, type=" response ")

         1 
0.00422564

ကားအသစ်တွင် manual ဂီယာ (am=1) ဖြစ်နိုင်ခြေသည် 0.004 ဖြစ်သည်ဟု မော်ဒယ်က ခန့်မှန်းသည်။ ဆိုလိုသည်မှာ ဤကားအသစ်သည် အော်တိုဂီယာပါရှိလာနိုင်ဖွယ်ရှိသည်။

ကျွန်ုပ်တို့တွင် ကားအသစ်များစွာပါရှိသော ဒေတာဘေ့စ်တစ်ခုရှိပါက ကျွန်ုပ်တို့တွင် တစ်ကြိမ်တည်းတွင် ခန့်မှန်းချက်များစွာကိုလည်း ပြုလုပ်နိုင်သည်ကို သတိပြုပါ။

ဥပမာအားဖြင့်၊ ကားအသစ်သုံးစီးအတွက် manual ဂီယာဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် တပ်ဆင်ထားသော မော်ဒယ်ကို အသုံးပြုနည်းကို အောက်ပါကုဒ်က ပြသသည်-

 #define new data frame of three cars
newdata = data. frame (disp=c(200, 180, 160),
                     hp=c(100, 90, 108))

#view data frame
newdata

  hp disp
1,200 100
2 180 90
3,160,108

#use model to predict value of am for all three cars
predict(model, newdata, type=" response ")

          1 2 3 
0.004225640 0.008361069 0.335916069 

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

  • ကား 1 တွင် manual ဂီယာပါရှိသော ဖြစ်နိုင်ခြေမှာ 0.004 ဖြစ်သည်။
  • ကား 2 တွင် manual ဂီယာပါရှိသော ဖြစ်နိုင်ခြေမှာ 0.008 ဖြစ်သည်။
  • ကား 3 တွင် manual ဂီယာပါရှိသော ဖြစ်နိုင်ခြေမှာ 0.336 ဖြစ်သည်။

မှတ်ချက်များ

ဒေတာဘောင်အသစ်ရှိ ကော်လံအမည်များသည် မော်ဒယ်ဖန်တီးရန်အတွက် အသုံးပြုခဲ့သည့် ဒေတာဘောင်ရှိ ကော်လံအမည်များနှင့် အတိအကျ ကိုက်ညီရပါမည်။

ကျွန်ုပ်တို့၏ယခင်နမူနာတွင်၊ မော်ဒယ်ကိုဖန်တီးရန်အသုံးပြုသည့်ဒေတာဘောင်တွင် ကျွန်ုပ်တို့၏ကြိုတင်ခန့်မှန်းကိန်းရှင်များအတွက် အောက်ပါကော်လံအမည်များပါရှိသည်ကို သတိပြုပါ။

  • ပြသခြင်း။
  • HP

ဒါကြောင့် newdata လို့ ခေါ်တဲ့ ဒေတာဘောင်အသစ်ကို ဖန်တီးတဲ့အခါ၊ ကော်လံတွေကို နာမည်တပ်ဖို့ သေချာစေခဲ့ပါတယ်။

  • ပြသခြင်း။
  • HP

ကော်လံအမည်များ မတိုက်ဆိုင်ပါက၊ သင်သည် အောက်ပါ အမှားသတင်းကို လက်ခံရရှိလိမ့်မည်-

eval တွင် အမှားအယွင်း (predvars၊ data၊ env)

predict() လုပ်ဆောင်ချက်ကို အသုံးပြုသည့်အခါ ၎င်းကို မှတ်သားထားပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် polynomial regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း
R တွင် ခန့်မှန်းကြားကာလတစ်ခုကို ဖန်တီးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်