R တွင် ခရမ်းရောင် cp ကို တွက်နည်း
ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုတွင်၊ Mallows Cp သည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာကြားတွင် အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံကို ရွေးချယ်ရန် အသုံးပြုသည့် မက်ထရစ်တစ်ခုဖြစ်သည်။
p သည် မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းကိန်းဂဏန်းများဖြစ်သည့် p +1 နှင့်နီးစပ်သော အနိမ့်ဆုံး Cp တန်ဖိုးဖြင့် မော်ဒယ်ကို ခွဲခြားသတ်မှတ်ခြင်းဖြင့် “ အကောင်းဆုံး” ဆုတ်ယုတ်မှုပုံစံကို ခွဲခြားသတ်မှတ်နိုင်ပါသည်။
R တွင် Mallows ၏ Cp ကိုတွက်ချက်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ olsrr ပက်ကေ့ခ်ျမှ ols_mallows_cp() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။
အောက်ဖော်ပြပါ ဥပမာသည် R ရှိ ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာကြားတွင် အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံကို ရွေးချယ်ရန် Mallows ၏ Cp ကို တွက်ချက်ရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသထားသည်။
ဥပမာ- R ဖြင့် Mallows Cp တွက်ချက်ခြင်း။
mtcars dataset မှ variable များကိုအသုံးပြု၍ မတူညီသောမျဥ်းညီထွေသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံသုံးမျိုးနှင့်ကိုက်ညီလိုသည်ဆိုကြပါစို့။
အောက်ဖော်ပြပါကုဒ်သည် အောက်ဖော်ပြပါ ဆုတ်ယုတ်မှုပုံစံများနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသသည်-
- မော်ဒယ်အပြည့်ရှိ ခန့်မှန်းကိန်းရှင်များ- ကိန်းရှင် 10 ခု
- မော်ဒယ် 1 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ hp၊ wt၊ qsec
- မော်ဒယ် 2 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ qsec
- ပုံစံ 3 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ wt
အောက်ဖော်ပြပါ ကုဒ်သည် ဤဆုတ်ယုတ်မှုပုံစံတစ်ခုစီနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသပြီး မော်ဒယ်တစ်ခုစီ၏ Mallows Cp ကို တွက်ချက်ရန် ols_mallows_cp() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ-
library (olsrr) #fit full model full_model <- lm(mpg ~ ., data = mtcars) #fit three smaller models model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars) model2 <- lm(mpg ~ disp + qsec, data = mtcars) model3 <- lm(mpg ~ disp + wt, data = mtcars) #calculate Mallows' Cp for each model ols_mallows_cp(model1, full_model) [1] 4.430434 ols_mallows_cp(model2, full_model) [1] 18.64082 ols_mallows_cp(model3, full_model) [1] 9.122225
ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-
- မော်ဒယ် 1: p + 1 = 5၊ Mallows Cp = 4.43
- မော်ဒယ် 2: p + 1 = 3, Mallows Cp = 18.64
- မော်ဒယ် 3: p + 1 = 30၊ Mallows Cp = 9.12
မော်ဒယ် 1 သည် p + 1 နှင့် အနီးစပ်ဆုံးဖြစ်သည့် Mallows’ Cp အတွက် တန်ဖိုးရှိသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ ၎င်းသည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်သုံးမျိုးတွင် ဘက်လိုက်မှုအနည်းဆုံးဖြစ်စေသည့် အကောင်းဆုံးမော်ဒယ်ဖြစ်ကြောင်း ညွှန်ပြပါသည်။
Cp des mauves တွင် မှတ်စုများ
ဤသည်မှာ Mallows Cp နှင့် ပတ်သက်၍ သတိထားရမည့်အချက်များ။
- ဖြစ်နိုင်ချေရှိသော မော်ဒယ်တစ်ခုစီတွင် Mallows Cp တန်ဖိုး မြင့်မားပါက၊ ၎င်းသည် မော်ဒယ်တစ်ခုစီမှ အရေးကြီးသော ကြိုတင်ခန့်မှန်းကိန်းရှင်အချို့ ပျောက်ဆုံးသွားဖွယ်ရှိကြောင်း ညွှန်ပြနေသည်။
- အလားအလာရှိသော မော်ဒယ်များစွာတွင် Mallow’s Cp အတွက် တန်ဖိုးနိမ့်ပါက၊ အသုံးပြုရန် အကောင်းဆုံးမော်ဒယ်အဖြစ် အနိမ့်ဆုံးတန်ဖိုးရှိသော မော်ဒယ်ကို ရွေးချယ်ပါ။
Mallows ၏ Cp သည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာကြားတွင် “ အကောင်းဆုံး” ဆုတ်ယုတ်မှုပုံစံကို ခွဲခြားသတ်မှတ်ရန် နည်းလမ်းတစ်ခုသာဖြစ်ကြောင်း မှတ်သားထားပါ။
နောက်ထပ်အသုံးများသည့်တိုင်းတာမှုမှာ ချိန်ညှိထားသော R-squared ဖြစ်ပြီး၊ အသုံးပြုထားသော ခန့်မှန်းကိန်းရှင်အရေအတွက်အတွက် ချိန်ညှိထားသော မော်ဒယ်ရှိ ကြိုတင်ကိန်းရှင်ကိန်းရှင်များဖြင့် ရှင်းပြနိုင်သည့် တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားကို ပြောပြသည်။
မတူညီသော မော်ဒယ်များစာရင်းတွင် မည်သည့် regression model သည် အကောင်းဆုံးဖြစ်သည်ကို ဆုံးဖြတ်ရန်အတွက် Mallows’ Cp နှင့် adjusted R-squared နှစ်ခုလုံးကို ကြည့်ရန် အကြံပြုအပ်ပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
R ဖြင့် ချိန်ညှိထားသော R-squared တွက်ချက်နည်း
AIC ကို R ဖြင့် တွက်နည်း