Multicollinearity
ဤဆောင်းပါးသည် ကိန်းဂဏန်းစာရင်းဇယားများတွင် ကော်လိုင်းအာနိသင်ရှိမှုကို ရှင်းပြထားသည်။ ထို့ကြောင့်၊ Multicollinearity တည်ရှိနေချိန်၊ Multicollinearity ၏အကျိုးဆက်များ၊ Multicollinearity ကိုမည်သို့ခွဲခြားသတ်မှတ်ရန်နှင့်နောက်ဆုံးတွင်၊ ဤပြဿနာကိုဖြေရှင်းနည်းကိုသင်တွေ့ရှိလိမ့်မည်။
Multicollinearity ဆိုတာ ဘာလဲ။
Multicollinearity သည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင် နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော ရှင်းလင်းချက်ကွဲလွဲချက်များ မြင့်မားသောဆက်စပ်မှုရှိသောအခါ ဖြစ်ပေါ်သည့်အခြေအနေတစ်ခုဖြစ်သည်။ တစ်နည်းဆိုရသော်၊ ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင်၊ မော်ဒယ်ရှိ ကိန်းရှင်နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော ကိန်းရှင်များကြား ဆက်ဆံရေးသည် အလွန်အားကောင်းနေသောအခါတွင် ကော်လိုင်းအာနိသင် တည်ရှိနေပါသည်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် နိုင်ငံတစ်ခု၏ ပျမ်းမျှသက်တမ်းကို ၎င်း၏လူဦးရေ အရွယ်အစားနှင့် GDP နှင့်ဆက်စပ်သော ဆုတ်ယုတ်မှုပုံစံကို လုပ်ဆောင်ပါက၊ ဤကိန်းရှင်နှစ်ခုသည် ယေဘုယျအားဖြင့် ပြင်းထန်စွာဆက်စပ်နေသောကြောင့် လူဦးရေအရွယ်အစားနှင့် GDP အကြားတွင် ကော်လိုင်းပေါင်းစုံပါဝင်မှုမှာ သေချာပေါက်ဖြစ်လိမ့်မည်။ ဆက်စပ်မှု။ ထို့ကြောင့် သက်တမ်းရှိ ကိန်းရှင်တစ်ခုစီ၏ အကျိုးသက်ရောက်မှုကို ခွဲခြမ်းစိတ်ဖြာရန် ခက်ခဲပါလိမ့်မည်။
ယုတ္တိဗေဒအရ၊ မော်ဒယ်တစ်ခုရှိ ကိန်းရှင်များသည် တစ်ခုနှင့်တစ်ခု အမြဲဆက်စပ်နေလိမ့်မည်။ idyllic process တွင်သာ variable များကြားတွင် ဆက်စပ်မှုမရှိသော ဆက်စပ်မှုကို ဖြစ်ပေါ်ပါသည်။ သို့သော်လည်း၊ ကျွန်ုပ်တို့စိတ်ဝင်စားသောအရာမှာ variables များကြား ဆက်စပ်မှု နည်းပါးနေသည်၊ သို့မဟုတ်ပါက တုံ့ပြန်မှု variable ပေါ်တွင် explanatory variable တစ်ခုစီ၏ အကျိုးသက်ရောက်မှုကို ကျွန်ုပ်တို့ မသိနိုင်ပါ။
multicollinearity ၏အဓိကအကြောင်းတရားများမှာ ယေဘူယျအားဖြင့် နမူနာ၏သေးငယ်သောအရွယ်အစား၊ ရှင်းလင်းချက်ပြောင်းနိုင်သောကိန်းရှင်များကြားတွင် အကြောင်းရင်းခံဆက်နွယ်မှုရှိခြင်း သို့မဟုတ် လေ့လာတွေ့ရှိချက်များ၏ ကွဲလွဲမှုနည်းပါးခြင်းတို့ဖြစ်သည်။
Multicollinearity အမျိုးအစားများ
Multicollinearity အမျိုးအစား နှစ်မျိုးရှိသည်။
- အတိအကျ multicollinearity : တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကိန်းရှင်များသည် အခြားကိန်းရှင်များ၏ မျဉ်းကြောင်းအတိုင်း ပေါင်းစပ်သည့်အခါ။ ဤကိစ္စတွင်၊ multicollinear variable များကြားရှိ ဆက်စပ်ကိန်းသည် 1 နှင့် ညီမျှသည်။
- အနီးစပ်ဆုံး Multicollinearity : ကိန်းရှင်များအကြား မျဉ်းသားပေါင်းစပ်မှု မရှိသော်လည်း ကိန်းရှင်နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော variable နှစ်ခုကြားတွင် ဆုံးဖြတ်ခြင်း၏ကိန်းဂဏန်းသည် 1 နှင့် အလွန်နီးစပ်သောကြောင့် ၎င်းတို့သည် အလွန်ဆက်စပ်နေပါသည်။
Multicollinearity ၏အကျိုးဆက်များ
- ဆက်စပ်ကိန်းရှင်များကို ထပ်ပေါင်းလိုက်သောအခါ မော်ဒယ်၏ ဆုတ်ယုတ်မှုကိန်းဂဏန်းများ၏ တန်ဖိုးသည် ပြောင်းလဲသွားကာ ရရှိလာသော ဆုတ်ယုတ်မှုပုံစံကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် ခက်ခဲစေသည်။
- ကန့်သတ်ချက်ခန့်မှန်းချက်၏ တိကျမှုကို လျှော့ချထားသောကြောင့် ဆုတ်ယုတ်မှုကိန်းဂဏန်းများ၏ စံအမှားသည် တိုးလာသည်။
- Multicollinearity ဖြစ်စေသော ကိန်းရှင်အချို့သည် မလိုအပ်တော့သည်မှာ သေချာသောကြောင့် ၎င်းတို့ကို မော်ဒယ်တွင် ထည့်သွင်းရန် မလိုအပ်ပါ။
- မော်ဒယ်သည် အလွန်အကျွံ အံဝင်ခွင်ကျဖြစ်နေသော အခြေအနေသို့ ရောက်သွားနိုင်ဖွယ်ရှိပြီး ဤအကြောင်းကြောင့် ကြိုတင်ခန့်မှန်းမှုများ ပြုလုပ်ရန်အတွက် အသုံးမဝင်ပေ။
- regression coefficients ၏ p-တန်ဖိုးများသည် ယုံကြည်စိတ်ချရမှုနည်းလာသည်။ ထို့ကြောင့်၊ regression model တွင် မည်သည့် variables များကို ထည့်သွင်းရန်နှင့် မည်သည့် variable များကို ဖယ်ရှားရမည်ကို ဆုံးဖြတ်ရန် ပို၍ခက်ခဲသည်။
Multicollinearity ကို ဘယ်လိုရှာဖွေမလဲ။
multicollinearity ကိုခွဲခြားသတ်မှတ်ရန်နည်းလမ်းတစ်ခုမှာ correlation matrix ကိုတွက်ချက်ရန်ဖြစ်သည် ၊ ၎င်းတွင် variable များအားလုံးကြားရှိဆက်စပ်ကိန်းများပါဝင်သောကြောင့်၊ ထို့ကြောင့်၊ variables တစ်စုံသည် အလွန်ဆက်စပ်နေပါက ၎င်းကိုလေ့လာနိုင်သည်။
သို့သော်၊ ဆက်စပ်မက်ထရစ်နှင့်အတူ၊ variable နှစ်ခုသည် တစ်ခုနှင့်တစ်ခု ဆက်စပ်မှုရှိမရှိကိုသာ သင်သိနိုင်သော်လည်း variable အစုတစ်ခုကြားတွင် ပေါင်းစပ်မှုရှိမရှိကို သင်မသိနိုင်ပါ။ ဒီလိုလုပ်ဖို့၊ ကွဲလွဲမှုငွေကြေးဖောင်းပွမှုအချက်ကို များသောအားဖြင့် တွက်ချက်ပါတယ်။
ကွဲလွဲမှုငွေကြေးဖောင်းပွမှုအချက် (VIF) ၊ ကွဲလွဲမှုငွေကြေးဖောင်းပွမှုအချက် (VIF) သည် တိကျသောကိန်းရှင်တစ်ခုစီအတွက် တွက်ချက်ထားသော ကိန်းဂဏန်းကိန်းဂဏန်းတစ်ခုဖြစ်ပြီး ပေးထားသောရှင်းပြကိန်းရှင်တစ်ခုနှင့် အခြားကိန်းရှင်များ၏ ဆက်စပ်မှုကို ညွှန်ပြသည်။ တိကျစွာ၊ ၎င်း၏ဖော်မြူလာမှာ အောက်ပါအတိုင်းဖြစ်သည်။
ရွှေ
ကိန်းရှင် iy ၏ ကွဲလွဲမှု၏ ငွေကြေးဖောင်းပွမှုအချက်ဖြစ်သည်။
dependent variable အဖြစ် i ပါရှိသော regression model ၏ coefficient သည် dependent variable နှင့် ကျန်တဲ့ variable များကို အမှီအခိုကင်းသော variable များဖြစ်သည်။
ထို့ကြောင့် ရရှိသော ကွဲပြားမှု ငွေကြေးဖောင်းပွမှု အကြောင်းရင်းများပေါ် မူတည်၍ multicollinearity ရှိ၊ မရှိ သိရှိနိုင်သည်-
- VIF = 1 : ကွဲလွဲမှုငွေကြေးဖောင်းပွမှုကိန်းဂဏန်းသည် 1 နှင့် ညီမျှသောအခါ၊ မှီခိုကိန်းရှင်နှင့် အခြားကိန်းရှင်များအကြား ဆက်စပ်မှုမရှိဟု ဆိုလိုသည်။
- 1 < IVF < 5 : ကိန်းရှင်များကြားတွင် ဆက်စပ်မှုရှိသော်လည်း အလယ်အလတ်ဖြစ်သည်။ မူအရ၊ စည်းလုံးညီညွှတ်မှုကို ပြုပြင်ရန် မည်သည့်လုပ်ဆောင်ချက်ကိုမျှ ကျင့်သုံးရန် မလိုအပ်ပါ။
- VIF > 5 : ကွဲလွဲမှုငွေကြေးဖောင်းပွမှုအချက် 1 ထက်များပါက၊ ၎င်းသည် မော်ဒယ်၏ multicollinearity မြင့်မားသောကြောင့် ၎င်းကိုဖြေရှင်းရန် ကြိုးပမ်းသင့်သည်။
လက်တွေ့တွင်၊ variance inflation factor ကို computer software ဖြင့် တွက်ချက်လေ့ရှိသည်၊ အကြောင်းမှာ variable တစ်ခုစီအတွက် regression model တစ်ခုကို ဖန်တီးပြီးနောက် coefficient တန်ဖိုးကို ကိုယ်တိုင်ရှာဖွေရန် အချိန်ကြာမြင့်မည်ဖြစ်သောကြောင့် ဖြစ်သည်။
Multicollinearity ကို ပြုပြင်ပါ။
အောက်ဖော်ပြပါ အစီအမံများသည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင် အစုလိုက်အစည်းပေါင်းစုံပြဿနာများကို ဖြေရှင်းရာတွင် အသုံးဝင်နိုင်သည်-
- နမူနာအရွယ်အစား သေးငယ်ပါက ဒေတာအရေအတွက် တိုးလာခြင်းဖြင့် အနီးစပ်ဆုံး multicollinearity ကို လျှော့ချနိုင်သည်။
- multicollinearity ကိုဖြစ်ပေါ်စေသော variable အားလုံးကိုဖယ်ရှားပါ။ ကိန်းရှင်များသည် အလွန်ဆက်နွယ်နေပါက၊ မော်ဒယ်တွင် အချက်အလက်အနည်းငယ် ဆုံးရှုံးမည်ဖြစ်ပြီး multicollinearity လျော့နည်းသွားမည်ဖြစ်သည်။
- တစ်စိတ်တစ်ပိုင်း အနည်းဆုံးစတုရန်းများ (PLS) စံနှုန်းကို အသုံးပြုခြင်းဖြင့် ဆုတ်ယုတ်မှုပုံစံကို ဖန်တီးပါ။
- တစ်ခါတစ်ရံတွင် သင်သည် multicollinearity ဖြင့် ဆုတ်ယုတ်မှုပုံစံကို ချန်ထားနိုင်သည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် ခန့်မှန်းမှုများပြုလုပ်ရန် မော်ဒယ်တစ်ခုကို ဖန်တီးလိုပြီး ၎င်းကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် မလိုအပ်ပါက၊ မှီခိုကိန်းရှင်၏တန်ဖိုးကို ခန့်မှန်းချက်အသစ်တစ်ခုဖြင့် ရှုမြင်သုံးသပ်မှုအသစ်တစ်ခုဖြင့် ကျွန်ုပ်တို့သည် multicollinearity ပုံစံသည် သူ့အလိုလို ပြန်ဖြစ်နေသည်ဟု ယူဆနိုင်ပါသည်။ လေ့လာတွေ့ရှိချက်အသစ်တွင်။