အင်္ဂါရပ်ရွေးချယ်မှုအတွက် r တွင် stepaic ကိုအသုံးပြုနည်း


Akaike Information Criterion ( AIC ) သည် မော်ဒယ်တစ်ခုသည် ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း တိုင်းတာရန် အသုံးပြုသည့် မက်ထရစ်တစ်ခုဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

AIC = 2K – 2 ln (L)

ရွှေ-

  • K- မော်ဒယ် ကန့်သတ်ချက်များ အရေအတွက်။ K ၏ မူရင်းတန်ဖိုးသည် 2 ဖြစ်သည်၊ ထို့ကြောင့် ခန့်မှန်းသူကိန်းရှင်တစ်ခုသာရှိသော မော်ဒယ်တွင် K တန်ဖိုး 2+1 = 3 ရှိပါမည်။
  • ln (L) : မော်ဒယ်၏ မှတ်တမ်းဖြစ်နိုင်ခြေ။ စာရင်းအင်းဆော့ဖ်ဝဲအများစုသည် သင့်အတွက် ဤတန်ဖိုးကို အလိုအလျောက်တွက်ချက်ပေးနိုင်ပါသည်။

AIC သည် ကန့်သတ်နံပါတ်များ အလွန်အကျွံသုံးသည့် မော်ဒယ်များကို အပြစ်ပေးစဉ်တွင် ဒေတာ၏ ကွဲလွဲမှုကို ရှင်းပြသည့် မော်ဒယ်ကို ရှာဖွေရန် ဒီဇိုင်းထုတ်ထားသည်။

အနိမ့်ဆုံး AIC တန်ဖိုးဖြင့် မော်ဒယ်ကို ထုတ်လုပ်ပေးမည့် ခန့်မှန်းသူကိန်းရှင်များ (သို့မဟုတ် “ အင်္ဂါရပ်များ” ) ကို သင်ရှာမတွေ့မချင်း သင်သည် stepAIC() လုပ်ဆောင်ချက်ကို R ရှိ MASS ပက်ကေ့ချ်မှ ကြိုတင်ခန့်မှန်းပေးသည့်ကိန်းရှင်များကို ထပ်ခါတလဲလဲ ပေါင်းထည့်ကာ ဖယ်ရှားနိုင်သည် ။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-

stepAIC(အရာဝတ္ထု၊ ဦးတည်ရာ၊ …)

ရွှေ-

  • အရာဝတ္ထု – ချိန်ညှိထားသော မော်ဒယ်အမည်
  • ဦးတည်ချက် – အသုံးပြုရန် ခြေလှမ်းရှာဖွေမှု အမျိုးအစား (“နောက်ပြန်”၊ “ရှေ့သို့” သို့မဟုတ် “နှစ်ခုလုံး”)

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- R တွင် အင်္ဂါရပ်ရွေးချယ်မှုအတွက် stepAIC() ကိုအသုံးပြုခြင်း။

ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် R တွင်တည်ဆောက်ထားသော mtcars dataset ကိုအသုံးပြုမည်ဖြစ်ပြီး၊ မတူညီသောကား ၃၂ စီးအတွက် မတူညီသော attribute 11 ခုတွင် တိုင်းတာမှုများပါရှိသည်။

 #view first six rows of mtcars dataset
head(mtcars)

                   mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင်နှင့် အောက်ဖော်ပြပါ ဖြစ်နိုင်ချေရှိသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် hp ကို အသုံးပြု၍ ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို အံကိုက်လုပ်လိုသည်ဆိုပါစို့။

  • စိုင်းစိုင်းခမ်းလှိုင်
  • ကိုယ်အလေးချိန်
  • ပြောရမှာပါ။
  • qsec

ဖြစ်နိုင်ချေအနည်းဆုံး AIC တန်ဖိုးဖြင့် မော်ဒယ်သို့ရောက်ရှိသည်အထိ ကျွန်ုပ်တို့သည် မော်ဒယ်မှ အမျိုးမျိုးသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များကို ပေါင်းထည့်ကာ နုတ်ရန် stepAIC () လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

 library (MASS)

#fit initial multiple linear regression model
model <- lm(hp ~ mpg + wt + drat + qsec, data=mtcars)

#use both forward and backward selection to find model with lowest AIC
stepAIC(model, direction=" both ")

Start: AIC=226.88
hp ~ mpg + wt + drat + qsec

       Df Sum of Sq RSS AIC
- drat 1 94.9 28183 224.98
- mpg 1 1519.4 29608 226.56
  none 28088 226.88
- wt 1 3861.9 31950 229.00
-qsec 1 28102.2 56190 247.06

Step: AIC=224.98
hp ~ mpg + wt + qsec

       Df Sum of Sq RSS AIC
- mpg 1 1424.5 29608 224.56
  none 28183 224.98
+ drat 1 94.9 28088 226.88
- wt 1 3797.9 31981 227.03
-qsec 1 29625.1 57808 245.97

Step: AIC=224.56
hp ~ wt + qsec

       Df Sum of Sq RSS AIC
  none 29608 224.56
+ mpg 1 1425 28183 224.98
+ drat 1 0 29608 226.56
- wt 1 43026 72633 251.28
-qsec 1 52881 82489 255.35

Call:
lm(formula = hp ~ wt + qsec, data = mtcars)

Coefficients:
(Intercept) wt qsec  
     441.26 38.67 -23.47  

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

(1) ပထမဦးစွာ၊ ကျွန်ုပ်တို့သည် ကြိုတင်ခန့်မှန်းကိန်းရှင် လေးမျိုးဖြင့် ဆုတ်ယုတ်မှုပုံစံကို တပ်ဆင်ခြင်းဖြင့် စတင်သည်။ ဤမော်ဒယ်တွင် AIC တန်ဖိုး 226.88 ရှိသည်။

(2) ထို့နောက်၊ stepAIC သည် drat ကို ကြိုတင်ခန့်မှန်းသည့်ကိန်းရှင်အဖြစ် ဖယ်ရှားခြင်းဖြင့် AIC တန်ဖိုးကို 224.98 သို့ ထပ်မံလျှော့ချမည်ကို ဆုံးဖြတ်သည်။

(3) ထို့နောက်၊ stepAIC မော်ဒယ်သည် စိုင်းစိုင်းခမ်းလှိုင်ကို ခန့်မှန်းသည့်ကိန်းရှင်အဖြစ် ဖယ်ရှားခြင်းဖြင့် AIC တန်ဖိုးကို 224.56 သို့ ထပ်မံလျှော့ချမည်ကို ဆုံးဖြတ်သည်။

(4) နောက်ဆုံးတွင်၊ stepAIC သည် ကိန်းရှင်များကို ပေါင်းထည့်ခြင်း သို့မဟုတ် ဖယ်ရှားခြင်းဖြင့် AIC တန်ဖိုးကို ထပ်မံလျှော့ချရန် နည်းလမ်းမရှိတော့ကြောင်း ဆုံးဖြတ်သည်။

ထို့ကြောင့် နောက်ဆုံးပုံစံမှာ-

ကောင်ရေ = 441.26 + 38.67 (အလေးချိန်) – 23.47 (qsec)

ဤမော်ဒယ်တွင် AIC တန်ဖိုး 224.56 ရှိသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် အပိုင်းပိုင်း ဆုတ်ယုတ်မှုကို မည်သို့လုပ်ဆောင်ရမည်နည်း
R တွင် spline regression လုပ်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်