R ဖြင့် aic တွက်နည်း (ဥပမာများအပါအဝင်)


Akaike Information Criterion (AIC) သည် များစွာသော ဆုတ်ယုတ်မှုပုံစံများ၏ အံကိုက်ကို နှိုင်းယှဉ်ရန် အသုံးပြုသည့် မက်ထရစ်တစ်ခုဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

AIC = 2K – 2 ln (L)

ရွှေ-

  • K- မော်ဒယ် ကန့်သတ်ချက်များ အရေအတွက်။ K ၏ မူရင်းတန်ဖိုးသည် 2 ဖြစ်သည်၊ ထို့ကြောင့် ခန့်မှန်းသူကိန်းရှင်တစ်ခုသာရှိသော မော်ဒယ်တွင် K တန်ဖိုး 2+1 = 3 ရှိပါမည်။
  • ln (L) : မော်ဒယ်၏ မှတ်တမ်းဖြစ်နိုင်ခြေ။ စာရင်းအင်းဆော့ဖ်ဝဲအများစုသည် သင့်အတွက် ဤတန်ဖိုးကို အလိုအလျောက်တွက်ချက်ပေးနိုင်ပါသည်။

AIC သည် ကန့်သတ်နံပါတ်များ အလွန်အကျွံသုံးသည့် မော်ဒယ်များကို အပြစ်ပေးစဉ်တွင် ဒေတာ၏ ကွဲလွဲမှုကို ရှင်းပြသည့် မော်ဒယ်ကို ရှာဖွေရန် ဒီဇိုင်းထုတ်ထားသည်။

သင်သည် များစွာသော ဆုတ်ယုတ်မှုပုံစံများကို တပ်ဆင်ပြီးသည်နှင့်၊ သင်သည် မော်ဒယ်တစ်ခုစီ၏ AIC တန်ဖိုးကို နှိုင်းယှဉ်နိုင်သည်။ AIC နိမ့်လေ၊ မော်ဒယ်က ပိုသင့်တော်လေဖြစ်သည်။

R တွင် များစွာသော ဆုတ်ယုတ်မှုပုံစံများ၏ AIC ကို တွက်ချက်ရန်၊ AICcmodavg ပက်ကေ့ခ်ျမှ aictab() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။

အောက်ဖော်ပြပါ ဥပမာသည် R တွင် အမျိုးမျိုးသော ဆုတ်ယုတ်မှုပုံစံများအတွက် AIC ကို တွက်ချက်ပြီး အဓိပ္ပာယ်ပြန်ဆိုရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသထားသည်။

ဥပမာ- AIC ကို R ဖြင့် တွက်ချက်ပြီး ဘာသာပြန်ပါ။

mtcars dataset မှ variable များကိုအသုံးပြု၍ မတူညီသော မျဥ်းညီထွေသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ သုံးမျိုးနှင့်ကိုက်ညီလိုသည်ဆိုကြပါစို့။

ဤသည်မှာ မော်ဒယ်တစ်ခုစီတွင် ကျွန်ုပ်တို့အသုံးပြုမည့် ခန့်မှန်းကိန်းရှင်များဖြစ်သည်-

  • မော်ဒယ် 1 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ hp၊ wt၊ qsec
  • မော်ဒယ် 2 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ qsec
  • ပုံစံ 3 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ wt

အောက်ဖော်ပြပါ ကုဒ်သည် ဤဆုတ်ယုတ်မှုပုံစံများ တစ်ခုစီနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသသည်-

 #fit three models
model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

ထို့နောက်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်များကို စာရင်းတစ်ခုတွင် ထည့်သွင်းပြီး မော်ဒယ်တစ်ခုစီ၏ AIC ကို တွက်ချက်ရန် aictab() လုပ်ဆောင်ချက်ကို အသုံးပြုပါမည်။

 library (AICcmodavg)

#define list of models
models <- list(model1, model2, model3)

#specify model names
mod.names <- c('disp.hp.wt.qsec', 'disp.qsec', 'disp.wt')

#calculate AIC of each model
aictab(cand.set = models, modnames = mod.names)

Model selection based on AICc:

                K AICc Delta_AICc AICcWt Cum.Wt LL
disp.hp.wt.qsec 6 162.43 0.00 0.83 0.83 -73.53
available wt 4 165.65 3.22 0.17 1.00 -78.08
disp.qsec 4 173.32 10.89 0.00 1.00 -81.92

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

  • K- မော်ဒယ်ရှိ ကန့်သတ်ချက်များ အရေအတွက်။
  • AICc- မော်ဒယ်၏ AIC တန်ဖိုး။ စာလုံးသေး “ c” သည် AIC ကို နမူနာငယ်များအတွက် ပြင်ဆင်ထားသော AIC မှ တွက်ချက်ထားကြောင်း ဖော်ပြသည်။
  • Delta_AICc- အကောင်းဆုံးမော်ဒယ်၏ AIC နှင့် လက်ရှိမော်ဒယ်၏ နှိုင်းယှဉ်ချက်အကြား ကွာခြားချက်။
  • AICcWt- မော်ဒယ်တွင် တွေ့ရှိနိုင်သည့် စုစုပေါင်း ခန့်မှန်းစွမ်းအား အချိုးအစား။
  • Cum.Wt : AIC အလေးချိန်များ၏ စုစည်းမှု ပေါင်းလဒ်။
  • LL- မော်ဒယ်၏ မှတ်တမ်းဖြစ်နိုင်ခြေ။ ၎င်းသည် ကျွန်ုပ်တို့အသုံးပြုခဲ့သည့်ဒေတာဖြင့် မော်ဒယ်ဖြစ်နိုင်ချေ မည်မျှရှိသည်ကို ကျွန်ုပ်တို့အား ပြောပြသည်။

အနိမ့်ဆုံး AIC တန်ဖိုးရှိသော မော်ဒယ်သည် အမြဲတမ်း ဦးစွာ စာရင်းသွင်းထားသည်။ ရလဒ်မှ အောက်ဖော်ပြပါ မော်ဒယ်သည် အနိမ့်ဆုံး AIC တန်ဖိုး ရှိပြီး ထို့ကြောင့် အသင့်တော်ဆုံး မော်ဒယ်ဖြစ်ကြောင်း ကျွန်ုပ်တို့ တွေ့နိုင်သည်-

mpg = β 0 + β 1 (disp) + β 2 (hp) + β 3 (အလေးချိန်) + β 4 (qsec)

ကျွန်ုပ်တို့သည် ဤမော်ဒယ်ကို အကောင်းဆုံးအဖြစ် သတ်မှတ်ပြီးသည်နှင့်၊ ကျွန်ုပ်တို့သည် ကြိုတင်ခန့်မှန်းကိန်းရှင်အစုများနှင့် တုံ့ပြန်မှုကိန်းရှင် ၏ တိကျသောဆက်နွယ်မှုကို ဆုံးဖြတ်ရန် R-squared တန်ဖိုးနှင့် beta coefficients အပါအဝင် ရလဒ်များကို ခွဲခြမ်းစိတ်ဖြာနိုင်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R ဖြင့် ချိန်ညှိထားသော R-squared တွက်ချက်နည်း
R ဖြင့် Mallows Cp ကို တွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်