Mallows ဆိုတာ ဘာလဲ။ cp? (အဓိပ္ပါယ်နှင့် ဥပမာ)


Mallows Cp သည် မတူညီသော မော်ဒယ်များကြားတွင် အကောင်းဆုံး ဆုတ်ယုတ်မှု မော်ဒယ်ကို ရွေးချယ်ရန် အသုံးပြုသည့် မက်ထရစ်တစ်ခု ဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

Cp = RSS p /S 2 – N+2(P+1)

ရွှေ-

  • RSS p : p ကြိုတွက်နိုင်သောကိန်းရှင်များပါသည့် မော်ဒယ်တစ်ခုအတွက် ကျန်ရှိသော လေးထောင့်ကိန်းများ
  • S 2 : မော်ဒယ်၏ ကျန်ရှိသော ပျမ်းမျှစတုရန်း (MSE မှ ခန့်မှန်းထားသည်)
  • N: နမူနာအရွယ်အစား
  • P: ကြိုတင်ခန့်မှန်းကိန်းရှင် အရေအတွက်

ကျွန်ုပ်တို့တွင် ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင် ကျွန်ုပ်တို့အသုံးပြုလိုသည့် ဖြစ်နိုင်ချေရှိသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များစွာရှိသည့် Mallows Cp ကို အသုံးပြုပြီး ဤကြိုတင်ခန့်မှန်းကိန်းရှင်များ၏ အစုခွဲကိုအသုံးပြုသည့် အကောင်းဆုံးပုံစံကို ဖော်ထုတ်လိုသည့်အခါတွင် အသုံးပြုပါသည်။

P သည် မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းကိန်းဂဏန်းများဖြစ်သည့် P+1 ထက်နည်းသော အနိမ့်ဆုံး Cp တန်ဖိုးဖြင့် မော်ဒယ်ကို ခွဲခြားသတ်မှတ်ခြင်းဖြင့် “ အကောင်းဆုံး” ဆုတ်ယုတ်မှုပုံစံကို ခွဲခြားသတ်မှတ်နိုင်ပါသည်။

အောက်ဖော်ပြပါ ဥပမာသည် ဖြစ်နိုင်ချေရှိသော မော်ဒယ်များစွာမှ အကောင်းဆုံး ဆုတ်ယုတ်မှု မော်ဒယ်ကို ရွေးချယ်ရန် Mallows ‘Cp ကို မည်သို့ အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- အကောင်းဆုံးမော်ဒယ်ကိုရွေးချယ်ရန် Mallows Cp ကိုအသုံးပြုခြင်း။

ပါမောက္ခတစ်ဦးသည် နောက်ဆုံးစာမေးပွဲတွင် ကျောင်းသားတစ်ဦးရရှိမည့် အတန်းကို ခန့်မှန်းရန် ဆုတ်ယုတ်မှုပုံစံရှိ ကိန်းရှင်များအဖြစ် လက်ရှိ စုဆောင်းထားသော GPA များကို ပါမောက္ခတစ်ဦးမှ အသုံးပြုလိုသည်ဆိုပါစို့။

၎င်းသည် မတူညီသော ဆုတ်ယုတ်မှုမော်ဒယ်ခုနစ်ခုနှင့် ကိုက်ညီပြီး မော်ဒယ်တစ်ခုစီအတွက် Mallows Cp တန်ဖိုးကို တွက်ချက်သည်-

အကောင်းဆုံး ဆုတ်ယုတ်မှု မော်ဒယ်ကို ရွေးချယ်ရန် Mallows Cp ကို အသုံးပြုခြင်း။

Mallows ၏ Cp တန်ဖိုးသည် model coefficients (P+1) ထက်နည်းပါက၊ မော်ဒယ်သည် ဘက်မလိုက်ဘဲဟု ဆိုပါသည်။

ဘက်မလိုက်သော ပုံစံနှစ်မျိုးရှိကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်-

  • ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် နာရီနှင့် GPA ပါသော မော်ဒယ် (Mallows’ Cp = 2.9၊ P+1 = 3)
  • ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် Prep စာမေးပွဲများနှင့် GPA ပါရှိသော မော်ဒယ် (Mallows’ Cp = 2.7၊ P+1 = 3)

ဤမော်ဒယ်နှစ်ခုတွင်၊ ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် ကြိုတင်ပြင်ဆင်သည့်စာမေးပွဲများနှင့် GPA ကိုအသုံးပြုသည့်မော်ဒယ်သည် Mallows’ Cp အတွက် အနိမ့်ဆုံးတန်ဖိုးဖြစ်သည်၊ ၎င်းသည် ဘက်လိုက်မှုအနည်းဆုံးရလဒ်ထွက်ပေါ်သည့် ပိုကောင်းတဲ့မော်ဒယ်ဖြစ်ကြောင်း ကျွန်ုပ်တို့ကိုပြောပြသည်။

Cp des mauves တွင် မှတ်စုများ

ဤသည်မှာ Mallows Cp နှင့် ပတ်သက်၍ သတိထားရမည့်အချက်များ။

  • P+1 နှင့်နီးစပ်သော Mallows Cp တန်ဖိုးရှိသော မော်ဒယ်များသည် ဘက်လိုက်မှုနည်းသည်ဟု ဆိုသည်။
  • ဖြစ်နိုင်ချေရှိသော မော်ဒယ်တစ်ခုစီတွင် Mallows Cp တန်ဖိုး မြင့်မားပါက၊ ၎င်းသည် မော်ဒယ်တစ်ခုစီမှ အရေးကြီးသော ကြိုတင်ခန့်မှန်းကိန်းရှင်အချို့ ပျောက်ဆုံးသွားဖွယ်ရှိကြောင်း ညွှန်ပြနေသည်။
  • အလားအလာရှိသော မော်ဒယ်များစွာတွင် Mallow’s Cp အတွက် တန်ဖိုးနိမ့်ပါက၊ အသုံးပြုရန် အကောင်းဆုံးမော်ဒယ်အဖြစ် အနိမ့်ဆုံးတန်ဖိုးရှိသော မော်ဒယ်ကို ရွေးချယ်ပါ။

Mallows ၏ Cp သည် ဆုတ်ယုတ်မှုပုံစံ၏ အံဝင်ခွင်ကျရှိမှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုသာဖြစ်ကြောင်း သတိပြုပါ။

နောက်ထပ်အသုံးများသည့်တိုင်းတာမှုမှာ ချိန်ညှိထားသော R-squared ဖြစ်ပြီး၊ အသုံးပြုထားသော ခန့်မှန်းကိန်းရှင်အရေအတွက်အတွက် ချိန်ညှိထားသော မော်ဒယ်ရှိ ကြိုတင်ကိန်းရှင်ကိန်းရှင်များဖြင့် ရှင်းပြနိုင်သည့် တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားကို ပြောပြသည်။

မတူညီသော မော်ဒယ်များစာရင်းမှ မည်သည့် regression model သည် အကောင်းဆုံးဖြစ်သည်ကို ဆုံးဖြတ်ရန် Mallows’ Cp နှင့် adjusted R-squared နှစ်ခုလုံးကို ကြည့်ရန် စိတ်ကူးကောင်းပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် Mallows Cp ကိုဘယ်လိုတွက်ရမလဲ
R ဖြင့် ချိန်ညှိထားသော R-squared တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်