R တွင် glm ဖြင့် ခန့်မှန်းသည့်လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း (ဥပမာများနှင့်အတူ)
R ရှိ glm() လုပ်ဆောင်ချက်ကို ယေဘူယျအားဖြင့် မျဉ်းသားထားသော မော်ဒယ်များနှင့် ကိုက်ညီရန် အသုံးပြုနိုင်သည်။ ဤအင်္ဂါရပ်သည် ထောက်ပံ့ ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံများ ၊ Poisson ဆုတ်ယုတ်မှုပုံစံများ နှင့် အခြားရှုပ်ထွေးသော မော်ဒယ်များအတွက် သင့်လျော်သည်။
ကျွန်ုပ်တို့သည် မော်ဒယ်တစ်ခုကို တပ်ဆင်ပြီးသည်နှင့်၊ ကျွန်ုပ်တို့သည် လေ့လာမှုအသစ်တစ်ခု၏ တုံ့ပြန်မှုတန်ဖိုးကို ခန့်မှန်းရန် ကြိုတင်ခန့်မှန်း() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။
ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-
ခန့်မှန်းချက်(အရာဝတ္ထု၊ ဒေတာအသစ်၊ အမျိုးအစား = “ တုံ့ပြန်မှု” )
ရွှေ-
- အရာဝတ္ထု- glm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ မော်ဒယ် ချိန်ညှိမှုအမည်
- newdata- ခန့် မှန်းချက်ပြုလုပ်ရန် ဒေတာဘောင်အသစ်၏ အမည်
- အမျိုးအစား- ခန့်မှန်းချက် အမျိုးအစား။
အောက်ဖော်ပြပါ ဥပမာသည် R တွင် ယေဘူယျအားဖြင့် မျဉ်းသားပုံစံကို မည်သို့ အံဝင်ခွင်ကျလုပ်ရမည်နှင့် ယခင်က မမြင်ဖူးသော စူးစမ်းမှုအသစ်၏ တုံ့ပြန်မှုတန်ဖိုးကို ခန့်မှန်းရန် မော်ဒယ်ကို မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။
ဥပမာ- R တွင် glm ဖြင့် ခန့်မှန်းချက်လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်း။
ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် mtcars ဟုခေါ်သော built-in R ဒေတာအတွဲကို အသုံးပြုပါမည်။
#view first six rows of mtcars data frame
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1
ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုပြောင်းလဲနိုင်သော am (ကား၏ဂီယာအမျိုးအစား- 0 = အလိုအလျောက်၊ 1 = manual) ကို ခန့်မှန်းရန် ကျွန်ုပ်တို့အသုံးပြုသည့် variables disp နှင့် hp တို့ကို အသုံးပြုထားသည့် အောက်ပါ logistic regression model နှင့် ကိုက်ညီပါမည်။
#fit logistic regression model model <- glm(am ~ disp + hp, data=mtcars, family=binomial) #view model summary summary(model) Call: glm(formula = am ~ disp + hp, family = binomial, data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -1.9665 -0.3090 -0.0017 0.3934 1.3682 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.40342 1.36757 1.026 0.3048 available -0.09518 0.04800 -1.983 0.0474 * hp 0.12170 0.06777 1.796 0.0725 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 43,230 on 31 degrees of freedom Residual deviance: 16,713 on 29 degrees of freedom AIC: 22,713 Number of Fisher Scoring iterations: 8
ကားအသစ်တွင် အော်တိုဂီယာ (am=0) သို့မဟုတ် manual ဂီယာ (am=1) အောက်ဖော်ပြပါကုဒ်ကို အသုံးပြု၍ ဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် ဤမော်ဒယ်ကို အသုံးပြုနိုင်ပါသည်။
#define new observation
newdata = data. frame (disp=200, hp=100)
#use model to predict value of am
predict(model, newdata, type=" response ")
1
0.00422564
ကားအသစ်တွင် manual ဂီယာ (am=1) ဖြစ်နိုင်ခြေသည် 0.004 ဖြစ်သည်ဟု မော်ဒယ်က ခန့်မှန်းသည်။ ဆိုလိုသည်မှာ ဤကားအသစ်သည် အော်တိုဂီယာပါရှိလာနိုင်ဖွယ်ရှိသည်။
ကျွန်ုပ်တို့တွင် ကားအသစ်များစွာပါရှိသော ဒေတာဘေ့စ်တစ်ခုရှိပါက ကျွန်ုပ်တို့တွင် တစ်ကြိမ်တည်းတွင် ခန့်မှန်းချက်များစွာကိုလည်း ပြုလုပ်နိုင်သည်ကို သတိပြုပါ။
ဥပမာအားဖြင့်၊ ကားအသစ်သုံးစီးအတွက် manual ဂီယာဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် တပ်ဆင်ထားသော မော်ဒယ်ကို အသုံးပြုနည်းကို အောက်ပါကုဒ်က ပြသသည်-
#define new data frame of three cars
newdata = data. frame (disp=c(200, 180, 160),
hp=c(100, 90, 108))
#view data frame
newdata
hp disp
1,200 100
2 180 90
3,160,108
#use model to predict value of am for all three cars
predict(model, newdata, type=" response ")
1 2 3
0.004225640 0.008361069 0.335916069
ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-
- ကား 1 တွင် manual ဂီယာပါရှိသော ဖြစ်နိုင်ခြေမှာ 0.004 ဖြစ်သည်။
- ကား 2 တွင် manual ဂီယာပါရှိသော ဖြစ်နိုင်ခြေမှာ 0.008 ဖြစ်သည်။
- ကား 3 တွင် manual ဂီယာပါရှိသော ဖြစ်နိုင်ခြေမှာ 0.336 ဖြစ်သည်။
မှတ်ချက်များ
ဒေတာဘောင်အသစ်ရှိ ကော်လံအမည်များသည် မော်ဒယ်ဖန်တီးရန်အတွက် အသုံးပြုခဲ့သည့် ဒေတာဘောင်ရှိ ကော်လံအမည်များနှင့် အတိအကျ ကိုက်ညီရပါမည်။
ကျွန်ုပ်တို့၏ယခင်နမူနာတွင်၊ မော်ဒယ်ကိုဖန်တီးရန်အသုံးပြုသည့်ဒေတာဘောင်တွင် ကျွန်ုပ်တို့၏ကြိုတင်ခန့်မှန်းကိန်းရှင်များအတွက် အောက်ပါကော်လံအမည်များပါရှိသည်ကို သတိပြုပါ။
- ပြသခြင်း။
- HP
ဒါကြောင့် newdata လို့ ခေါ်တဲ့ ဒေတာဘောင်အသစ်ကို ဖန်တီးတဲ့အခါ၊ ကော်လံတွေကို နာမည်တပ်ဖို့ သေချာစေခဲ့ပါတယ်။
- ပြသခြင်း။
- HP
ကော်လံအမည်များ မတိုက်ဆိုင်ပါက၊ သင်သည် အောက်ပါ အမှားသတင်းကို လက်ခံရရှိလိမ့်မည်-
eval တွင် အမှားအယွင်း (predvars၊ data၊ env)
predict() လုပ်ဆောင်ချက်ကို အသုံးပြုသည့်အခါ ၎င်းကို မှတ်သားထားပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် polynomial regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း
R တွင် ခန့်မှန်းကြားကာလတစ်ခုကို ဖန်တီးနည်း