Regression ရှိ multicollinearity & vif အတွက် လမ်းညွှန်


ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုတွင် Multicollinearity သည် ဆုတ်ယုတ်မှုပုံစံတွင် ထူးခြားသော သို့မဟုတ် အမှီအခိုကင်းသော အချက်အလက်များကို ပေးစွမ်းနိုင်ခြင်း မရှိသည့် ကိန်းရှင်နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော ကိန်းရှင်များသည် တစ်ခုနှင့်တစ်ခု အလွန်ဆက်စပ်နေသောအခါတွင် ဖြစ်ပေါ်သည်။

ကိန်းရှင်များကြားတွင် ဆက်စပ်ဆက်စပ်မှုဒီဂရီသည် လုံလောက်စွာမြင့်မားပါက၊ ၎င်းသည် ဆုတ်ယုတ်မှုပုံစံကို အံဝင်ခွင်ကျဖြစ်စေပြီး အနက်ပြန်ဆိုရာတွင် ပြဿနာများဖြစ်စေနိုင်သည်။

ဥပမာအားဖြင့်၊ သင်သည် အမြင့်ဆုံးဒေါင်လိုက်ခုန် တုံ့ပြန်မှုကိန်းရှင် နှင့် အောက်ပါကြိုတင်ခန့်မှန်းကိန်းရှင်များကို အသုံးပြု၍ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာချက်ကို လုပ်ဆောင်သည်ဆိုပါစို့။

  • အမြင့်
  • ဖိနပ်ဆိုဒ်
  • တစ်နေ့ကို နာရီပေါင်းများစွာ လေ့ကျင့်ခဲ့ရပါတယ်။

ဤကိစ္စတွင်၊ အရပ် နှင့် ဖိနပ်အရွယ်အစားသည် အရပ်ရှည်သူများတွင် ပိုကြီးသောဖိနပ်အရွယ်အစားရှိတတ်သောကြောင့် အရပ်ရှည်သူများနှင့် ဖိနပ်အရွယ်အစားသည် အလွန်ဆက်စပ်နိုင်ဖွယ်ရှိသည်။ ဆိုလိုသည်မှာ multicollinearity သည် ဤဆုတ်ယုတ်မှုတွင် ပြဿနာတစ်ခု ဖြစ်နိုင်သည်ဟု ဆိုလိုသည်။

ဤသင်ခန်းစာတွင် multicollinearity သည် ပြဿနာတစ်ခုဖြစ်ရခြင်းအကြောင်း၊ ၎င်းကိုသိရှိနိုင်ပုံနှင့် ၎င်းကိုဖြေရှင်းနည်းတို့ကို ရှင်းပြထားသည်။

Multicollinearity က ဘာကြောင့် ပြဿနာဖြစ်တာလဲ။

ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှု၏ အဓိကပန်းတိုင်များထဲမှတစ်ခုမှာ ခန့်မှန်းသူကိန်းရှင်တစ်ခုစီနှင့် တုံ့ပြန်မှုကိန်းရှင်ကြားရှိ ဆက်နွယ်မှုကို ခွဲထုတ်ရန်ဖြစ်သည်။

အထူးသဖြင့်၊ ကျွန်ုပ်တို့သည် ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်သောအခါ၊ ကျွန်ုပ်တို့သည် စံနမူနာရှိ အခြားကြိုတင်ခန့်မှန်းကိန်းရှင်များအားလုံးကို ကိန်းသေအဖြစ် ဆက်လက်တည်ရှိနေသည်ဟု ယူဆကာ တုံ့ပြန်မှုကိန်းရှင်၏ ပျမ်းမျှပြောင်းလဲမှုအဖြစ် ဆုတ်ယုတ်မှုကိန်းဂဏန်းတစ်ခုစီကို အဓိပ္ပာယ်ပြန်ဆိုပါသည်။

ဆိုလိုသည်မှာ ကျွန်ုပ်တို့သည် အခြားသော ခန့်မှန်းသူကိန်းရှင်များ၏ တန်ဖိုးများကို မပြောင်းလဲဘဲ ပေးထားသော ခန့်မှန်းသူကိန်းရှင်၏ တန်ဖိုးများကို ပြောင်းလဲနိုင်သည်ဟု ကျွန်ုပ်တို့ ယူဆပါသည်။

သို့သော်၊ နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော ခန့်မှန်းနိုင်သောကိန်းရှင်များသည် အလွန်ဆက်စပ်နေသောအခါ၊ အခြားတစ်ခုကို မပြောင်းလဲဘဲ ကိန်းရှင်တစ်ခုကို ပြောင်းလဲရန် ခက်ခဲလာသည်။

ခန့်မှန်းသူကိန်းရှင်များသည် တညီတညွတ်တည်းပြောင်းလဲလေ့ရှိသောကြောင့် ဆုတ်ယုတ်မှုပုံစံသည် ခန့်မှန်းသူကိန်းရှင်တစ်ခုစီနှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား ဆက်နွယ်မှုကို လွတ်လပ်စွာခန့်မှန်းရန် ခက်ခဲစေသည်။

ယေဘူယျအားဖြင့် Multicollinearity သည် ပြဿနာ နှစ်မျိုး ဖြစ်ပေါ်စေသည် ။

  • မော်ဒယ်၏ ဖော်ကိန်း ခန့်မှန်းချက်များ (နှင့် ဖော်ကိန်းများ၏ လက္ခဏာများ) သည် မော်ဒယ်တွင် ပါဝင်သော အခြားသော ခန့်မှန်းသူ ကိန်းရှင်များပေါ်မူတည်၍ သိသိသာသာ ပြောင်းလဲနိုင်သည်။
  • ကိန်းဂဏန်းခန့်မှန်းချက်များ၏ တိကျမှုသည် လျော့ကျသွားပြီး p-values များကို စိတ်မချရဖြစ်စေသည်။ ၎င်းသည် မည်သည့် ခန့်မှန်းချက်ကိန်းရှင်များသည် အမှန်တကယ် စာရင်းအင်းအရ သိသာထင်ရှားကြောင်း ဆုံးဖြတ်ရန် ခက်ခဲစေသည်။

Multicollinearity ကို ဘယ်လိုရှာဖွေမလဲ။

multicollinearity ကိုရှာဖွေရန်အသုံးအများဆုံးနည်းလမ်းမှာ regression model တစ်ခုရှိ ခန့်မှန်းသူကိန်းရှင်များကြားရှိ ဆက်စပ်မှုနှင့် ခိုင်ခံ့မှုကို တိုင်းတာသည့် varianance inflation factor (VIF) ကို အသုံးပြုခြင်းဖြစ်သည်။

Variance Inflation Factor (VIF) ကိုအသုံးပြုခြင်း၊

စာရင်းအင်းဆော့ဖ်ဝဲအများစုသည် ဆုတ်ယုတ်မှုပုံစံအတွက် VIF ကို တွက်ချက်နိုင်စွမ်းရှိသည်။ VIF တန်ဖိုးသည် 1 မှစတင်ပြီး အထက်ကန့်သတ်ချက်မရှိပါ။ VIF များကို ဘာသာပြန်ရန်အတွက် ယေဘူယျစည်းမျဉ်းမှာ-

  • 1 ၏တန်ဖိုးသည် ပေးထားသော ခန့်မှန်းပေးသူကိန်းရှင်နှင့် မော်ဒယ်ရှိ အခြားကြိုတင်ခန့်မှန်းကိန်းရှင်ကြား ဆက်နွယ်မှုမရှိကြောင်း ညွှန်ပြသည်။
  • 1 နှင့် 5 ကြားရှိ တန်ဖိုးသည် ပေးထားသော ခန့်မှန်းပေးသူ ကိန်းရှင်နှင့် မော်ဒယ်ရှိ အခြားသော ခန့်မှန်းသူ ကိန်းရှင်များကြား အလယ်အလတ် ဆက်စပ်မှုကို ညွှန်ပြသော်လည်း အထူးသတိထားရန် လိုအပ်လောက်အောင် ပြင်းထန်လေ့မရှိပါ။
  • 5 ထက်ကြီးသောတန်ဖိုးသည် ပေးထားသော ခန့်မှန်းသူကိန်းရှင်နှင့် မော်ဒယ်ရှိ အခြားကြိုတင်ခန့်မှန်းကိန်းရှင်များကြား ဖြစ်နိုင်ချေရှိသော ပြင်းထန်သောဆက်စပ်မှုကို ညွှန်ပြသည်။ ဤကိစ္စတွင်၊ ဆုတ်ယုတ်မှုရလဒ်များတွင် ကိန်းဂဏန်းခန့်မှန်းချက်များနှင့် p-တန်ဖိုးများသည် ယုံကြည်စိတ်ချရဖွယ်မရှိပေ။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် ဘတ်စကက်ဘောကစားသမားများ၏ အများဆုံးဒေါင်လိုက်ခုန် ခြင်းကို ခန့်မှန်းပြီး အောက်ပါရလဒ်များကို ရရှိရန်အတွက် အမြင့်ဖိနပ်အရွယ်အစား နှင့် ခန့်မှန်းတွက်ချက်မှုပုံစံများ ကို အသုံးပြု၍ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာချက်တစ်ခု လုပ်ဆောင်သည်ဆိုပါစို့။

နောက်ဆုံးကော်လံတွင်၊ အရပ်အမြင့် နှင့် ဖိနပ်အရွယ်အစား အတွက် VIF တန်ဖိုးများသည် 5 ထက် ကြီးသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ ၎င်းသည် ၎င်းတို့သည် ကော်လိုင်းပေါင်းစုံမှ ခံစားရနိုင်ခြေရှိပြီး ၎င်းတို့၏ coefficient ခန့်မှန်းချက်နှင့် p-တန်ဖိုးများသည် ယုံကြည်စိတ်ချရဖွယ်မရှိဟု ညွှန်ပြပါသည်။

ဖိနပ်အရွယ်အစားအတွက် ကိန်းဂဏန်းခန့်မှန်းချက်ကို ကြည့်ပါက၊ ဖိနပ်အရွယ်အစား တိုးလာမှုတစ်ခုစီအတွက်၊ အမြင့်ဆုံးဒေါင်လိုက်ခုန် နှုန်းသည် -0.67498 လက်မဖြစ်ပြီး အမြင့်နှင့် လေ့ကျင့်ချိန်များသည် အမြဲမပြတ်ရှိနေမည်ဟု ယူဆပါသည်။

ပိုကြီးတဲ့ဖိနပ်တွေနဲ့ ကစားသမားတွေက ပိုမြင့်ပြီး အမြင့်ဆုံးဒေါင်လိုက်ခုန်ဖို့ မျှော်လင့်ထားတာကြောင့် ဒါက အဓိပ္ပာယ်မရှိဘူး၊

၎င်းသည် ကိန်းဂဏန်းခန့်မှန်းချက်များကို အနည်းငယ်အလှမ်းဝေးပြီး နားလည်ရလွယ်ကူမှုမရှိပုံပေါ်စေသည့် multicollinearity ၏ ဂန္တဝင်ဥပမာတစ်ခုဖြစ်သည်။

Multicollinearity ကို ဘယ်လိုဖြေရှင်းမလဲ။

အကယ်၍ သင်သည် multicollinearity ကိုတွေ့ရှိပါက၊ နောက်တစ်ဆင့်မှာ ၎င်းကို တစ်နည်းနည်းဖြင့် ဖြေရှင်းရန် လိုအပ်သည်ဆိုသည်ကို ဆုံးဖြတ်ရန်ဖြစ်သည်။ သင်၏ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှု၏ပန်းတိုင်ပေါ် မူတည်၍ သင်သည် multicollinearity ကိုဖြေရှင်းရန်မလိုအပ်ပါ။

သိရန်-

1. အလယ်အလတ် Multicollinearity သာရှိလျှင် ၎င်းကို မည်သည့်နည်းဖြင့် ဖြေရှင်းရန် မလိုအပ်ပါ။

2. Multicollinearity သည် တစ်ခုနှင့်တစ်ခုဆက်စပ်နေသည့် ကြိုတင်ခန့်မှန်းကိန်းရှင်များကိုသာ အကျိုးသက်ရောက်သည်။ အကယ်၍ သင်သည် multicollinearity ကိုမခံစားရသောမော်ဒယ်ရှိကြိုတင်ခန့်မှန်းကိန်းရှင်ကိုစိတ်ဝင်စားပါက၊ multicollinearity သည်ပြဿနာမဟုတ်ပါ။

3. Multicollinearity သည် ကိန်းဂဏန်းခန့်မှန်းချက်များနှင့် p-တန်ဖိုးများကို သက်ရောက်မှုရှိသော်လည်း ၎င်းသည် ခန့်မှန်းချက်များ သို့မဟုတ် အံဝင်ခွင်ကျကောင်းသော ကိန်းဂဏန်းများကို သက်ရောက်မှုမရှိပါ။ ဆိုလိုသည်မှာ ဆုတ်ယုတ်မှု၏ အဓိကပန်းတိုင်မှာ ကြိုတင်ခန့်မှန်းမှုများပြုလုပ်ရန်ဖြစ်ပြီး ခန့်မှန်းသူကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား တိကျသောဆက်နွယ်မှုကို သင်နားမလည်ပါက၊ ပေါင်းစည်းမှုကွဲပြားမှုကို ဖြေရှင်းရန်မလိုအပ်ပါ။

multicollinearity ကို ပြုပြင်ရန် လိုအပ်သည်ဟု သင်ဆုံးဖြတ်ပါက၊ အချို့သော ဘုံဖြေရှင်းနည်းများ ပါဝင်သည်။

1. အလွန်ဆက်စပ်နေသော ကိန်းရှင်များကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပို၍ ဖယ်ရှားပါ။ ဤအရာသည် ကိစ္စအများစုတွင် အလျင်မြန်ဆုံးဖြေရှင်းချက်ဖြစ်ပြီး မကြာခဏဆိုသလိုပင် သင်ဖယ်ရှားလိုက်သော ကိန်းရှင်များသည် မလိုအပ်ဘဲနှင့် မော်ဒယ်သို့ ထူးခြားသော သို့မဟုတ် အမှီအခိုကင်းသော အချက်အလက်အနည်းငယ်ကို ထည့်ထားသောကြောင့် လက်ခံနိုင်ဖွယ်ရှိသော ဖြေရှင်းချက်တစ်ခုဖြစ်သည်။

2. ကြိုတင်ခန့်မှန်းကိန်းရှင်များကို တစ်နည်းနည်းဖြင့် ပေါင်းထည့်ခြင်း သို့မဟုတ် နုတ်ခြင်းကဲ့သို့သော တစ်နည်းနည်းဖြင့် မျဉ်းသားစွာ ပေါင်းစပ်ပါသည်။ ထိုသို့ပြုလုပ်ခြင်းဖြင့်၊ သင်သည် variable နှစ်ခုလုံးမှ အချက်အလက်များကို လွှမ်းခြုံနိုင်သော variable အသစ်တစ်ခုကို ဖန်တီးနိုင်ပြီး သင့်တွင် multicollinearity ပြဿနာ မရှိတော့ပါ။

3. အဓိကအစိတ်အပိုင်းခွဲခြမ်းစိတ်ဖြာခြင်း သို့မဟုတ် တစ်စိတ်တစ်ပိုင်းအနည်းဆုံးစတုရန်းများ (PLS) ဆုတ်ယုတ်မှု ကဲ့သို့သော အလွန်ဆက်စပ်နေသော ကိန်းရှင်များအတွက် ထည့်သွင်းထားသော ခွဲခြမ်းစိတ်ဖြာမှုကို လုပ်ဆောင်ပါ။ ဤနည်းပညာများသည် အလွန်ဆက်စပ်နေသော ခန့်မှန်းသူကိန်းရှင်များကို ကိုင်တွယ်ရန် အထူးဒီဇိုင်းထုတ်ထားပါသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်