R ဖြင့် aic တွက်နည်း (ဥပမာများအပါအဝင်)
Akaike Information Criterion (AIC) သည် များစွာသော ဆုတ်ယုတ်မှုပုံစံများ၏ အံကိုက်ကို နှိုင်းယှဉ်ရန် အသုံးပြုသည့် မက်ထရစ်တစ်ခုဖြစ်သည်။
အောက်ပါအတိုင်း တွက်ချက်သည်။
AIC = 2K – 2 ln (L)
ရွှေ-
- K- မော်ဒယ် ကန့်သတ်ချက်များ အရေအတွက်။ K ၏ မူရင်းတန်ဖိုးသည် 2 ဖြစ်သည်၊ ထို့ကြောင့် ခန့်မှန်းသူကိန်းရှင်တစ်ခုသာရှိသော မော်ဒယ်တွင် K တန်ဖိုး 2+1 = 3 ရှိပါမည်။
- ln (L) : မော်ဒယ်၏ မှတ်တမ်းဖြစ်နိုင်ခြေ။ စာရင်းအင်းဆော့ဖ်ဝဲအများစုသည် သင့်အတွက် ဤတန်ဖိုးကို အလိုအလျောက်တွက်ချက်ပေးနိုင်ပါသည်။
AIC သည် ကန့်သတ်နံပါတ်များ အလွန်အကျွံသုံးသည့် မော်ဒယ်များကို အပြစ်ပေးစဉ်တွင် ဒေတာ၏ ကွဲလွဲမှုကို ရှင်းပြသည့် မော်ဒယ်ကို ရှာဖွေရန် ဒီဇိုင်းထုတ်ထားသည်။
သင်သည် များစွာသော ဆုတ်ယုတ်မှုပုံစံများကို တပ်ဆင်ပြီးသည်နှင့်၊ သင်သည် မော်ဒယ်တစ်ခုစီ၏ AIC တန်ဖိုးကို နှိုင်းယှဉ်နိုင်သည်။ AIC နိမ့်လေ၊ မော်ဒယ်က ပိုသင့်တော်လေဖြစ်သည်။
R တွင် များစွာသော ဆုတ်ယုတ်မှုပုံစံများ၏ AIC ကို တွက်ချက်ရန်၊ AICcmodavg ပက်ကေ့ခ်ျမှ aictab() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။
အောက်ဖော်ပြပါ ဥပမာသည် R တွင် အမျိုးမျိုးသော ဆုတ်ယုတ်မှုပုံစံများအတွက် AIC ကို တွက်ချက်ပြီး အဓိပ္ပာယ်ပြန်ဆိုရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသထားသည်။
ဥပမာ- AIC ကို R ဖြင့် တွက်ချက်ပြီး ဘာသာပြန်ပါ။
mtcars dataset မှ variable များကိုအသုံးပြု၍ မတူညီသော မျဥ်းညီထွေသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ သုံးမျိုးနှင့်ကိုက်ညီလိုသည်ဆိုကြပါစို့။
ဤသည်မှာ မော်ဒယ်တစ်ခုစီတွင် ကျွန်ုပ်တို့အသုံးပြုမည့် ခန့်မှန်းကိန်းရှင်များဖြစ်သည်-
- မော်ဒယ် 1 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ hp၊ wt၊ qsec
- မော်ဒယ် 2 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ qsec
- ပုံစံ 3 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ wt
အောက်ဖော်ပြပါ ကုဒ်သည် ဤဆုတ်ယုတ်မှုပုံစံများ တစ်ခုစီနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသသည်-
#fit three models
model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)
ထို့နောက်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်များကို စာရင်းတစ်ခုတွင် ထည့်သွင်းပြီး မော်ဒယ်တစ်ခုစီ၏ AIC ကို တွက်ချက်ရန် aictab() လုပ်ဆောင်ချက်ကို အသုံးပြုပါမည်။
library (AICcmodavg) #define list of models models <- list(model1, model2, model3) #specify model names mod.names <- c('disp.hp.wt.qsec', 'disp.qsec', 'disp.wt') #calculate AIC of each model aictab(cand.set = models, modnames = mod.names) Model selection based on AICc: K AICc Delta_AICc AICcWt Cum.Wt LL disp.hp.wt.qsec 6 162.43 0.00 0.83 0.83 -73.53 available wt 4 165.65 3.22 0.17 1.00 -78.08 disp.qsec 4 173.32 10.89 0.00 1.00 -81.92
ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-
- K- မော်ဒယ်ရှိ ကန့်သတ်ချက်များ အရေအတွက်။
- AICc- မော်ဒယ်၏ AIC တန်ဖိုး။ စာလုံးသေး “ c” သည် AIC ကို နမူနာငယ်များအတွက် ပြင်ဆင်ထားသော AIC မှ တွက်ချက်ထားကြောင်း ဖော်ပြသည်။
- Delta_AICc- အကောင်းဆုံးမော်ဒယ်၏ AIC နှင့် လက်ရှိမော်ဒယ်၏ နှိုင်းယှဉ်ချက်အကြား ကွာခြားချက်။
- AICcWt- မော်ဒယ်တွင် တွေ့ရှိနိုင်သည့် စုစုပေါင်း ခန့်မှန်းစွမ်းအား အချိုးအစား။
- Cum.Wt : AIC အလေးချိန်များ၏ စုစည်းမှု ပေါင်းလဒ်။
- LL- မော်ဒယ်၏ မှတ်တမ်းဖြစ်နိုင်ခြေ။ ၎င်းသည် ကျွန်ုပ်တို့အသုံးပြုခဲ့သည့်ဒေတာဖြင့် မော်ဒယ်ဖြစ်နိုင်ချေ မည်မျှရှိသည်ကို ကျွန်ုပ်တို့အား ပြောပြသည်။
အနိမ့်ဆုံး AIC တန်ဖိုးရှိသော မော်ဒယ်သည် အမြဲတမ်း ဦးစွာ စာရင်းသွင်းထားသည်။ ရလဒ်မှ အောက်ဖော်ပြပါ မော်ဒယ်သည် အနိမ့်ဆုံး AIC တန်ဖိုး ရှိပြီး ထို့ကြောင့် အသင့်တော်ဆုံး မော်ဒယ်ဖြစ်ကြောင်း ကျွန်ုပ်တို့ တွေ့နိုင်သည်-
mpg = β 0 + β 1 (disp) + β 2 (hp) + β 3 (အလေးချိန်) + β 4 (qsec)
ကျွန်ုပ်တို့သည် ဤမော်ဒယ်ကို အကောင်းဆုံးအဖြစ် သတ်မှတ်ပြီးသည်နှင့်၊ ကျွန်ုပ်တို့သည် ကြိုတင်ခန့်မှန်းကိန်းရှင်အစုများနှင့် တုံ့ပြန်မှုကိန်းရှင် ၏ တိကျသောဆက်နွယ်မှုကို ဆုံးဖြတ်ရန် R-squared တန်ဖိုးနှင့် beta coefficients အပါအဝင် ရလဒ်များကို ခွဲခြမ်းစိတ်ဖြာနိုင်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R ဖြင့် ချိန်ညှိထားသော R-squared တွက်ချက်နည်း
R ဖြင့် Mallows Cp ကို တွက်နည်း