မော်ဒယ်ရွေးချယ်မှုအတွက် r တွင် regsubsets() ကို မည်သို့အသုံးပြုရမည်နည်း။
အကောင်းဆုံးဆုတ်ယုတ်မှုပုံစံကိုထုတ်လုပ်ပေးမည့် ခန့်မှန်းသူကိန်းရှင်များ၏ အစုခွဲကိုရှာဖွေရန် regsubsets() လုပ်ဆောင်ချက်ကို R ရှိ ခုန်ပျံသည့် အထုပ်မှ သင်အသုံးပြုနိုင်ပါသည်။
အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ- R တွင် မော်ဒယ်ရွေးချယ်မှုအတွက် regsubsets() ကို အသုံးပြုခြင်း။
ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် မတူညီသောကား ၃၂ စီးအတွက် မတူညီသော အရည်အချင်း ၁၁ ခုတွင် တိုင်းတာမှုများပါရှိသော R တွင်တည်ဆောက်ထားသော mtcars ဒေတာအတွဲကို အသုံးပြုပါမည်။
#view first six rows of mtcars dataset
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1
ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင်နှင့် အောက်ဖော်ပြပါ ဖြစ်နိုင်ချေရှိသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် hp ကို အသုံးပြု၍ ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို အံကိုက်လုပ်လိုသည်ဆိုပါစို့။
- စိုင်းစိုင်းခမ်းလှိုင်
- ကိုယ်အလေးချိန်
- ပြောရမှာပါ။
- qsec
အကောင်းဆုံးဆုတ်ယုတ်မှုပုံစံကိုရှာဖွေရန် အပြည့်အ၀ရှာဖွေမှုလုပ်ဆောင်ရန် regsubsets() လုပ်ဆောင်ချက်ကို ခုန်ပျံသော အထုပ်မှ ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
library (leaps)
#find best regression model
bestSubsets <- regsubsets(hp ~ mpg + wt + drat + qsec, data=mtcars)
#view results
summary(bestSubsets)
Subset selection object
Call: regsubsets.formula(hp ~ mpg + wt + drat + qsec, data = mtcars)
4 Variables (and intercept)
Forced in Forced out
mpg FALSE FALSE
wt FALSE FALSE
drat FALSE FALSE
qsec FALSE FALSE
1 subsets of each size up to 4
Selection Algorithm: exhaustive
mpg wt drat qsec
1 ( 1 ) "*" " " " " " "
2 (1) " " "*" " " "*"
3 ( 1 ) “*” “*” “ “ “*”
4 ( 1 ) “*” “*” “*” “*”
ရလဒ်၏အောက်ခြေရှိ ကြယ်များ ( * ) သည် ကြိုတင်ခန့်မှန်းကိန်းရှင်အရေအတွက် မတူညီသော ဖြစ်နိုင်သည့်ပုံစံတစ်ခုစီအတွက် အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံနှင့် သက်ဆိုင်သည့် ခန့်မှန်းကိန်းရှင်များကို ဖော်ပြသည်။
ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-
ခန့်မှန်းချက်ကိန်းရှင်တစ်ခုတည်းပါသော မော်ဒယ်အတွက်၊ အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံကို ကြိုတင်ခန့်မှန်းကိန်းရှင်အဖြစ် mpg ကို အသုံးပြု၍ ထုတ်လုပ်သည်။
ကြိုတင်ခန့်မှန်းကိန်းရှင်နှစ်ခုပါသော မော်ဒယ်တစ်ခုအတွက်၊ အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံကို ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် wt နှင့် qsec ကို အသုံးပြု၍ ထုတ်လုပ်သည်။
ကြိုတင်ခန့်မှန်းကိန်းရှင် သုံးခုပါသော မော်ဒယ်တစ်ခုအတွက်၊ အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံကို ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် mpg ၊ wt နှင့် qsec ကို အသုံးပြု၍ ထုတ်လုပ်သည်။
ခန့်မှန်းသူ ကိန်းရှင် လေးခုပါသော မော်ဒယ်အတွက်၊ အကောင်းဆုံး ဆုတ်ယုတ်မှု မော်ဒယ်ကို ခန့်မှန်းသူ ကိန်းရှင်များအဖြစ် mpg ၊ wt ၊ drat နှင့် qsec တို့ကို အသုံးပြု၍ ထုတ်လုပ်ပါသည်။
မော်ဒယ်တစ်ခုစီအတွက် အောက်ပါ မက်ထရစ်များကို ထုတ်ယူနိုင်သည်ကို သတိပြုပါ။
- rsq : မော်ဒယ်တစ်ခုစီအတွက် r နှစ်ထပ်ကိန်းတန်ဖိုး
- RSS – မော်ဒယ်တစ်ခုစီအတွက် ကျန်ရှိသော လေးထောင့်ကိန်းများ
- adjr2- မော်ဒယ်တစ်ခုစီအတွက် ချိန်ညှိထားသော r-squared တန်ဖိုး
- cp : မော်ဒယ်တစ်ခုစီအတွက် Mallows Cp
- bic : မော်ဒယ်တစ်ခုစီအတွက် BIC တန်ဖိုး
ဥပမာအားဖြင့်၊ အကောင်းဆုံးမော်ဒယ်လေးခုတစ်ခုစီအတွက် တပ်ဆင်ထားသော R-squared တန်ဖိုးကို ထုတ်ယူရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
#view adjusted R-squared value of each model
summary(bestSubsets)$adjr2
[1] 0.5891853 0.7828169 0.7858829 0.7787005
ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-
- ကြိုတင်ခန့်မှန်းကိန်းရှင် ကိန်း ရှင် အဖြစ် ချိန်ညှိထားသော R-squared တန်ဖိုးသည် 0.589 ဖြစ်သည်။
- ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် wt နှင့် qsec ဖြင့် ချိန်ညှိထားသော R-squared တန်ဖိုးသည် 0.783 ဖြစ်သည်။
- ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် mp g ၊ wt နှင့် qsec ဖြင့် ချိန်ညှိထားသော R-squared တန်ဖိုးသည် 0.786 ဖြစ်သည်။
- ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် mpg , wt , drat နှင့် qsec ဖြင့် ချိန်ညှိထားသော R-squared တန်ဖိုးသည် 0.779 ဖြစ်သည်။
ဤတန်ဖိုးများသည် မော်ဒယ်ရှိ ခန့်မှန်းသူကိန်းရှင်များ အရေအတွက်ပေါ်မူတည်၍ တုံ့ပြန်မှုကိန်းရှင်၏တန်ဖိုးကို မည်မျှကောင်းစွာ ခန့်မှန်းထားသည်ကို အကြံဥာဏ်တစ်ခုပေးသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် အပိုင်းပိုင်း ဆုတ်ယုတ်မှုကို မည်သို့လုပ်ဆောင်ရမည်နည်း
R တွင် spline regression လုပ်နည်း