R တွင် ခရမ်းရောင် cp ကို တွက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 25, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုတွင်၊ Mallows Cp သည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာကြားတွင် အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံကို ရွေးချယ်ရန် အသုံးပြုသည့် မက်ထရစ်တစ်ခုဖြစ်သည်။

p သည် မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းကိန်းဂဏန်းများဖြစ်သည့် p +1 နှင့်နီးစပ်သော အနိမ့်ဆုံး Cp တန်ဖိုးဖြင့် မော်ဒယ်ကို ခွဲခြားသတ်မှတ်ခြင်းဖြင့် “ အကောင်းဆုံး” ဆုတ်ယုတ်မှုပုံစံကို ခွဲခြားသတ်မှတ်နိုင်ပါသည်။

R တွင် Mallows ၏ Cp ကိုတွက်ချက်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ olsrr ပက်ကေ့ခ်ျမှ ols_mallows_cp() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် R ရှိ ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာကြားတွင် အကောင်းဆုံး ဆုတ်ယုတ်မှုပုံစံကို ရွေးချယ်ရန် Mallows ၏ Cp ကို တွက်ချက်ရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသထားသည်။

ဥပမာ- R ဖြင့် Mallows Cp တွက်ချက်ခြင်း။

mtcars dataset မှ variable များကိုအသုံးပြု၍ မတူညီသောမျဥ်းညီထွေသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံသုံးမျိုးနှင့်ကိုက်ညီလိုသည်ဆိုကြပါစို့။

အောက်ဖော်ပြပါကုဒ်သည် အောက်ဖော်ပြပါ ဆုတ်ယုတ်မှုပုံစံများနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသသည်-

မော်ဒယ်အပြည့်ရှိ ခန့်မှန်းကိန်းရှင်များ- ကိန်းရှင် 10 ခု
မော်ဒယ် 1 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ hp၊ wt၊ qsec
မော်ဒယ် 2 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ qsec
ပုံစံ 3 တွင် ခန့်မှန်းကိန်းရှင်များ- disp၊ wt

အောက်ဖော်ပြပါ ကုဒ်သည် ဤဆုတ်ယုတ်မှုပုံစံတစ်ခုစီနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသပြီး မော်ဒယ်တစ်ခုစီ၏ Mallows Cp ကို တွက်ချက်ရန် ols_mallows_cp() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ-

 library (olsrr)

#fit full model
full_model <- lm(mpg ~ ., data = mtcars)

#fit three smaller models
model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

#calculate Mallows' Cp for each model
ols_mallows_cp(model1, full_model)

[1] 4.430434

ols_mallows_cp(model2, full_model)

[1] 18.64082

ols_mallows_cp(model3, full_model)

[1] 9.122225

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

မော်ဒယ် 1: p + 1 = 5၊ Mallows Cp = 4.43
မော်ဒယ် 2: p + 1 = 3, Mallows Cp = 18.64
မော်ဒယ် 3: p + 1 = 30၊ Mallows Cp = 9.12

မော်ဒယ် 1 သည် p + 1 နှင့် အနီးစပ်ဆုံးဖြစ်သည့် Mallows’ Cp အတွက် တန်ဖိုးရှိသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ ၎င်းသည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်သုံးမျိုးတွင် ဘက်လိုက်မှုအနည်းဆုံးဖြစ်စေသည့် အကောင်းဆုံးမော်ဒယ်ဖြစ်ကြောင်း ညွှန်ပြပါသည်။

Cp des mauves တွင် မှတ်စုများ

ဤသည်မှာ Mallows Cp နှင့် ပတ်သက်၍ သတိထားရမည့်အချက်များ။

ဖြစ်နိုင်ချေရှိသော မော်ဒယ်တစ်ခုစီတွင် Mallows Cp တန်ဖိုး မြင့်မားပါက၊ ၎င်းသည် မော်ဒယ်တစ်ခုစီမှ အရေးကြီးသော ကြိုတင်ခန့်မှန်းကိန်းရှင်အချို့ ပျောက်ဆုံးသွားဖွယ်ရှိကြောင်း ညွှန်ပြနေသည်။
အလားအလာရှိသော မော်ဒယ်များစွာတွင် Mallow’s Cp အတွက် တန်ဖိုးနိမ့်ပါက၊ အသုံးပြုရန် အကောင်းဆုံးမော်ဒယ်အဖြစ် အနိမ့်ဆုံးတန်ဖိုးရှိသော မော်ဒယ်ကို ရွေးချယ်ပါ။

Mallows ၏ Cp သည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာကြားတွင် “ အကောင်းဆုံး” ဆုတ်ယုတ်မှုပုံစံကို ခွဲခြားသတ်မှတ်ရန် နည်းလမ်းတစ်ခုသာဖြစ်ကြောင်း မှတ်သားထားပါ။

နောက်ထပ်အသုံးများသည့်တိုင်းတာမှုမှာ ချိန်ညှိထားသော R-squared ဖြစ်ပြီး၊ အသုံးပြုထားသော ခန့်မှန်းကိန်းရှင်အရေအတွက်အတွက် ချိန်ညှိထားသော မော်ဒယ်ရှိ ကြိုတင်ကိန်းရှင်ကိန်းရှင်များဖြင့် ရှင်းပြနိုင်သည့် တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားကို ပြောပြသည်။

မတူညီသော မော်ဒယ်များစာရင်းတွင် မည်သည့် regression model သည် အကောင်းဆုံးဖြစ်သည်ကို ဆုံးဖြတ်ရန်အတွက် Mallows’ Cp နှင့် adjusted R-squared နှစ်ခုလုံးကို ကြည့်ရန် အကြံပြုအပ်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

R ဖြင့် ချိန်ညှိထားသော R-squared တွက်ချက်နည်း
AIC ကို R ဖြင့် တွက်နည်း

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

ဥပမာ- R ဖြင့် Mallows Cp တွက်ချက်ခြင်း။

Cp des mauves တွင် မှတ်စုများ

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။