နောက်ကြောင်းပြန်ရွေးချယ်ခြင်းဟူသည် အဘယ်နည်း။ (အဓိပ္ပါယ် & #038; ဥပမာ)
ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ အဆင့်လိုက်ရွေးချယ်ခြင်း သည် ကိန်းဂဏန်းစာရင်းဝင်ရန် ခိုင်လုံသောအကြောင်းပြချက်မရှိတော့မချင်း ကြိုတင်ခန့်မှန်းသူအား ကိန်းရှင်အစုတစ်ခုမှ ဆုတ်ယုတ်မှုပုံစံ တစ်ခုတည်ဆောက်ရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် လုပ်ငန်းစဉ်တစ်ခုဖြစ်သည်။ သို့မဟုတ် နောက်ထပ်ဖျက်ပါ။
အဆင့်ဆင့်ရွေးချယ်ခြင်း၏ ပန်းတိုင်မှာ တုံ့ပြန်မှုကိန်းရှင် နှင့် ကိန်းဂဏန်းအရ သိသာထင်ရှားစွာဆက်စပ်နေသည့် ကြိုတင်ခန့်မှန်းကိန်းရှင်အားလုံးပါဝင်သည့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို ဖန်တီးရန်ဖြစ်သည်။
အသုံးများဆုံး အဆင့်ဆင့်ရွေးချယ်ရေးနည်းလမ်းများထဲမှ တစ်ခုကို backward selection ဟုခေါ်သည် ၊ အောက်ပါအတိုင်း အလုပ်လုပ်သည် ။
အဆင့် 1- p ကြိုတင်ခန့်မှန်းကိန်းရှင်အားလုံးကို အသုံးပြု၍ ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို ကွက်တိပါ။ မော်ဒယ်အတွက် AIC * တန်ဖိုးကို တွက်ချက်ပါ။
အဆင့် 2- AIC တွင် အကြီးကျယ်ဆုံးလျော့ပါးမှုကို ဖြစ်စေသည့် ကြိုတင်ခန့်မှန်းကိန်းရှင်ကို ဖယ်ရှားပြီး p ကြိုတင်ခန့်မှန်းကိန်းရှင်အားလုံးနှင့် မော်ဒယ်နှင့် နှိုင်းယှဉ်ပါက AIC တွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော လျော့ကျမှုကို ဖြစ်ပေါ်စေသည်။
အဆင့် 3- AIC တွင် အကြီးကျယ်ဆုံးလျော့ပါးမှုကို ဖြစ်စေသည့် ကြိုတင်ခန့်မှန်းကိန်းရှင်ကို ဖယ်ရှားပြီး p-1 ကြိုတင်ခန့်မှန်းသည့်ကိန်းရှင်များနှင့် နှိုင်းယှဉ်ပါက AIC တွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော လျော့ကျမှုကို ဖြစ်ပေါ်စေသည်။
AIC တွင် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော လျှော့ချမှုကို မဖြစ်ပေါ်စေနိုင်မချင်း ကြိုတင်ခန့်မှန်းနိုင်သော ကိန်းရှင်များကို မဖယ်ရှားမချင်း လုပ်ငန်းစဉ်ကို ပြန်လုပ်ပါ။
* ဖြတ်ကျော်အတည်ပြုချက်ခန့်မှန်းချက်အမှား၊ Cp၊ BIC၊ AIC သို့မဟုတ် ချိန်ညှိထားသော R2 အပါအဝင် ဆုတ်ယုတ်မှုပုံစံ၏ အံဝင်ခွင်ကျဖြစ်မှုကို တွက်ချက်ရန် သင်အသုံးပြုနိုင်သည့် မက်ထရစ်များစွာရှိပါသည်။ အောက်ပါဥပမာတွင်၊ ကျွန်ုပ်တို့သည် AIC ကိုအသုံးပြုရန်ရွေးချယ်သည်။
အောက်ဖော်ပြပါ ဥပမာသည် R တွင် နောက်ပြန်ရွေးချယ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။
ဥပမာ- R တွင် နောက်ပြန်ရွေးချယ်မှု
ဤဥပမာအတွက်၊ R တွင်တည်ဆောက်ထားသော mtcars dataset ကို အသုံးပြုပါမည်။
#view first six rows of mtcars
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1
တုံ့ပြန်မှုကိန်းရှင်နှင့် ဖြစ်နိုင်ချေရှိသော ခန့်မှန်းကိန်းရှင်များအဖြစ် ဒေတာသတ်မှတ်ထားသည့် အခြားကိန်းရှင် 10 ခုကို တုံ့ပြန်မှုကိန်းရှင်အဖြစ် mpg (တစ်ဂါလံလျှင် မိုင်) ကို အသုံးပြု၍ များစွာသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံကို ဖြည့်ဆည်းပေးပါမည်။
အောက်ဖော်ပြပါ ကုဒ်သည် နောက်ပြန်ဆုတ်နည်းကို ပြသသည်-
#define intercept-only model intercept_only <- lm(mpg ~ 1, data=mtcars) #define model with all predictors all <- lm(mpg ~ ., data=mtcars) #perform backward stepwise regression backward <- step(all, direction=' backward ', scope= formula (all), trace=0) #view results of backward stepwise regression backward$anova Step Df Deviance Resid. Df Resid. Dev AIC 1 NA NA 21 147.4944 70.89774 2 - cyl 1 0.07987121 22 147.5743 68.91507 3 - vs 1 0.26852280 23 147.8428 66.97324 4 - carb 1 0.68546077 24 148.5283 65.12126 5 - gear 1 1.56497053 25 150.0933 63.45667 6 - drat 1 3.34455117 26 153.4378 62.16190 7 - available 1 6.62865369 27 160.0665 61.51530 8 - hp 1 9.21946935 28 169.2859 61.30730 #view final model backward$coefficients (Intercept) wt qsec am 9.617781 -3.916504 1.225886 2.935837
ဤသည်မှာ ရလဒ်များကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-
ပထမဦးစွာ၊ ကျွန်ုပ်တို့သည် ကြိုတင်ခန့်မှန်းကိန်းရှင် 10 ကိုအသုံးပြု၍ မော်ဒယ်တစ်ခုအား ဖြည့်သွင်းပြီး မော်ဒယ်၏ AIC ကို တွက်ချက်ပါသည်။
ထို့နောက်၊ ကျွန်ုပ်တို့သည် AIC တွင် အကြီးမားဆုံးလျှော့ချမှုကို ဖြစ်ပေါ်စေသည့် ကိန်းရှင် ( cyl ) ကို ဖယ်ရှားပြီး 10 ခန့်မှန်းသူ ကိန်းရှင်ပုံစံနှင့် နှိုင်းယှဉ်ပါက AIC တွင် ကိန်းဂဏန်း သိသိသာသာ လျော့ကျသွားပါသည်။
ထို့နောက်၊ ကျွန်ုပ်တို့သည် AIC တွင် အကြီးမားဆုံး လျှော့ချမှုကို ဖြစ်စေသော ကိန်းရှင် ( vs ) ကို ဖယ်ရှားခဲ့ပြီး 9-predictor ခန့်မှန်းသူ variable model နှင့် နှိုင်းယှဉ်ပါက AIC တွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော လျှော့ချမှုကိုလည်း ရရှိခဲ့သည်။
ထို့နောက်၊ ကျွန်ုပ်တို့သည် AIC တွင် အကြီးမားဆုံးလျှော့ချမှုကို ဖြစ်ပေါ်စေသည့် ကိန်းရှင် ( ကာဗိုဟိုက်ဒရိတ် ) ကို ဖယ်ရှားပြီး 8-predictor variable model နှင့် နှိုင်းယှဉ်ပါက AIC တွင် ကိန်းဂဏန်းဆိုင်ရာ သိသာထင်ရှားသော လျော့ကျမှုကိုလည်း ရရှိခဲ့သည်။
AIC တွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော လျော့ကျမှုကို မဖြစ်ပေါ်စေသည့် မည်သည့်ကိန်းရှင်ကိုမျှ မဖယ်ရှားမချင်း ကျွန်ုပ်တို့သည် ဤလုပ်ငန်းစဉ်ကို ထပ်ခါတလဲလဲ လုပ်ဆောင်ပါသည်။
နောက်ဆုံးပုံစံသည်-
mpg = 9.62 – 3.92*weight + 1.23*qsec + 2.94*am
AIC အသုံးပြုခြင်းဆိုင်ရာ မှတ်ချက်
ယခင်နမူနာတွင်၊ ကျွန်ုပ်တို့သည် အမျိုးမျိုးသောဆုတ်ယုတ်မှုပုံစံများ၏ အံဝင်ခွင်ကျအကဲဖြတ်ရန် AIC ကို မက်ထရစ်တစ်ခုအဖြစ် အသုံးပြုရန် ရွေးချယ်ခဲ့သည်။
AIC သည် Akaike Information Criterion ကို ကိုယ်စားပြုပြီး အောက်ပါအတိုင်း တွက်ချက်ပါသည်။
AIC = 2K – 2 ln (L)
ရွှေ-
- K- မော်ဒယ် ကန့်သတ်ချက်များ အရေအတွက်။
- ln (L) : မော်ဒယ်၏ မှတ်တမ်းဖြစ်နိုင်ခြေ။ ၎င်းသည် ဒေတာပေးထားသော မော်ဒယ်၏ ဖြစ်နိုင်ခြေကို ပြောပြသည်။
သို့သော်၊ ဖြတ်ကျော်စစ်ဆေးခြင်းဆိုင်ရာ ခန့်မှန်းချက်အမှား၊ Cp၊ BIC၊ AIC သို့မဟုတ် ချိန်ညှိထားသော R2 အပါအဝင် ဆုတ်ယုတ်မှုပုံစံများ၏ အံဝင်ခွင်ကျအကဲဖြတ်ရန် သင်အသုံးပြုရန် ရွေးချယ်နိုင်သည့် အခြားမက်ထရစ်များရှိပါသည်။
ကံကောင်းထောက်မစွာ၊ စာရင်းအင်းဆော့ဖ်ဝဲအများစုသည် နောက်ကြောင်းပြန်စစ်ဆေးသည့်အခါ သင်အသုံးပြုလိုသည့်မက်ထရစ်ကို သတ်မှတ်နိုင်စေပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ဆုတ်ယုတ်မှုပုံစံများအကြောင်း နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-
တိုက်ရိုက်ရွေးချယ်ခြင်းမိတ်ဆက်
Regression ရှိ Multicollinearity နှင့် VIF အတွက်လမ်းညွှန်
ကောင်းသော AIC တန်ဖိုးကို အဘယ်အရာက သတ်မှတ်သနည်း။