R တွင် ခရမ်းရောင် cp ကို တွက်နည်း


ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုတွင်၊ Mallows Cp သည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာကြားတွင် အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံကို ရွေးချယ်ရန် အသုံးပြုသည့် မက်ထရစ်တစ်ခုဖြစ်သည်။

p သည် မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းကိန်းဂဏန်းများဖြစ်သည့် p +1 နှင့်နီးစပ်သော အနိမ့်ဆုံး Cp တန်ဖိုးဖြင့် မော်ဒယ်ကို ခွဲခြားသတ်မှတ်ခြင်းဖြင့် “ အကောင်းဆုံး” ဆုတ်ယုတ်မှုပုံစံကို ခွဲခြားသတ်မှတ်နိုင်ပါသည်။

R တွင် Mallows ၏ Cp ကိုတွက်ချက်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ olsrr ပက်ကေ့ခ်ျမှ ols_mallows_cp() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် R ရှိ ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာကြားတွင် အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံကို ရွေးချယ်ရန် Mallows ၏ Cp ကို တွက်ချက်ရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသထားသည်။

ဥပမာ- R ဖြင့် Mallows Cp တွက်ချက်ခြင်း။

mtcars dataset မှ variable များကိုအသုံးပြု၍ မတူညီသောမျဥ်းညီထွေသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံသုံးမျိုးနှင့်ကိုက်ညီလိုသည်ဆိုကြပါစို့။

အောက်ဖော်ပြပါကုဒ်သည် အောက်ဖော်ပြပါ ဆုတ်ယုတ်မှုပုံစံများနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသသည်-

  • မော်ဒယ်အပြည့်ရှိ ခန့်မှန်းကိန်းရှင်များ- ကိန်းရှင် 10 ခု
  • မော်ဒယ် 1 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ hp၊ wt၊ qsec
  • မော်ဒယ် 2 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ qsec
  • ပုံစံ 3 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ wt

အောက်ဖော်ပြပါ ကုဒ်သည် ဤဆုတ်ယုတ်မှုပုံစံတစ်ခုစီနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသပြီး မော်ဒယ်တစ်ခုစီ၏ Mallows Cp ကို တွက်ချက်ရန် ols_mallows_cp() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ-

 library (olsrr)

#fit full model
full_model <- lm(mpg ~ ., data = mtcars)

#fit three smaller models
model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

#calculate Mallows' Cp for each model
ols_mallows_cp(model1, full_model)

[1] 4.430434

ols_mallows_cp(model2, full_model)

[1] 18.64082

ols_mallows_cp(model3, full_model)

[1] 9.122225

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

  • မော်ဒယ် 1: p + 1 = 5၊ Mallows Cp = 4.43
  • မော်ဒယ် 2: p + 1 = 3, Mallows Cp = 18.64
  • မော်ဒယ် 3: p + 1 = 30၊ Mallows Cp = 9.12

မော်ဒယ် 1 သည် p + 1 နှင့် အနီးစပ်ဆုံးဖြစ်သည့် Mallows’ Cp အတွက် တန်ဖိုးရှိသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ ၎င်းသည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်သုံးမျိုးတွင် ဘက်လိုက်မှုအနည်းဆုံးဖြစ်စေသည့် အကောင်းဆုံးမော်ဒယ်ဖြစ်ကြောင်း ညွှန်ပြပါသည်။

Cp des mauves တွင် မှတ်စုများ

ဤသည်မှာ Mallows Cp နှင့် ပတ်သက်၍ သတိထားရမည့်အချက်များ။

  • ဖြစ်နိုင်ချေရှိသော မော်ဒယ်တစ်ခုစီတွင် Mallows Cp တန်ဖိုး မြင့်မားပါက၊ ၎င်းသည် မော်ဒယ်တစ်ခုစီမှ အရေးကြီးသော ကြိုတင်ခန့်မှန်းကိန်းရှင်အချို့ ပျောက်ဆုံးသွားဖွယ်ရှိကြောင်း ညွှန်ပြနေသည်။
  • အလားအလာရှိသော မော်ဒယ်များစွာတွင် Mallow’s Cp အတွက် တန်ဖိုးနိမ့်ပါက၊ အသုံးပြုရန် အကောင်းဆုံးမော်ဒယ်အဖြစ် အနိမ့်ဆုံးတန်ဖိုးရှိသော မော်ဒယ်ကို ရွေးချယ်ပါ။

Mallows ၏ Cp သည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာကြားတွင် “ အကောင်းဆုံး” ဆုတ်ယုတ်မှုပုံစံကို ခွဲခြားသတ်မှတ်ရန် နည်းလမ်းတစ်ခုသာဖြစ်ကြောင်း မှတ်သားထားပါ။

နောက်ထပ်အသုံးများသည့်တိုင်းတာမှုမှာ ချိန်ညှိထားသော R-squared ဖြစ်ပြီး၊ အသုံးပြုထားသော ခန့်မှန်းကိန်းရှင်အရေအတွက်အတွက် ချိန်ညှိထားသော မော်ဒယ်ရှိ ကြိုတင်ကိန်းရှင်ကိန်းရှင်များဖြင့် ရှင်းပြနိုင်သည့် တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားကို ပြောပြသည်။

မတူညီသော မော်ဒယ်များစာရင်းတွင် မည်သည့် regression model သည် အကောင်းဆုံးဖြစ်သည်ကို ဆုံးဖြတ်ရန်အတွက် Mallows’ Cp နှင့် adjusted R-squared နှစ်ခုလုံးကို ကြည့်ရန် အကြံပြုအပ်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

R ဖြင့် ချိန်ညှိထားသော R-squared တွက်ချက်နည်း
AIC ကို R ဖြင့် တွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်