Stata တွင် multicollinearity ကိုစမ်းသပ်နည်း


ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုတွင် Multicollinearity သည် ဆုတ်ယုတ်မှုပုံစံတွင် ထူးခြားသော သို့မဟုတ် အမှီအခိုကင်းသော အချက်အလက်များကို ပေးဆောင်ခြင်းမရှိသည့် နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော ရှင်းပြချက်တစ်ခုနှင့်တစ်ခု တစ်ခုနှင့်တစ်ခု အလွန်ဆက်စပ်နေသောအခါတွင် ဖြစ်ပေါ်သည်။ ကိန်းရှင်များကြားတွင် ဆက်စပ်ဆက်စပ်မှုဒီဂရီသည် လုံလောက်စွာမြင့်မားပါက၊ ၎င်းသည် ဆုတ်ယုတ်မှုပုံစံကို အံဝင်ခွင်ကျဖြစ်စေပြီး အနက်ပြန်ဆိုရာတွင် ပြဿနာများဖြစ်စေနိုင်သည်။

ဥပမာအားဖြင့်၊ သင်သည် အောက်ပါကိန်းရှင်များနှင့်အတူ မျဉ်းကြောင်းပြန်ဆုတ်မှုများစွာကို လုပ်ဆောင်သည်ဆိုပါစို့။

ပြောင်းလဲနိုင်သော တုံ့ပြန်မှု- အများဆုံး ဒေါင်လိုက်ခုန်ခြင်း။

ရှင်းလင်းချက်ပြောင်းလွဲချက်များ- ဖိနပ်အရွယ်အစား၊ အမြင့်၊ လေ့ကျင့်ချိန်

ဤကိစ္စတွင်၊ အရပ်ရှည်သူများသည် ဖိနပ်အရွယ်အစား ပိုကြီးလေ့ရှိသောကြောင့် ဖိနပ်အရွယ်အစားနှင့် အမြင့်သည် ပြင်းထန်စွာ ဆက်စပ်မှုရှိနိုင်သည် ။ ဆိုလိုသည်မှာ multicollinearity သည် ဤဆုတ်ယုတ်မှုတွင် ပြဿနာတစ်ခု ဖြစ်နိုင်သည်ဟု ဆိုလိုသည်။

ကံကောင်းထောက်မစွာ၊ ဆုတ်ယုတ်မှုပုံစံတွင် ရှင်းပြထားသောကိန်းရှင်များကြားတွင် ဆက်စပ်မှုနှင့် ခိုင်ခံ့မှုကို တိုင်းတာသည့် variance inflation factor (VIF) ဟုခေါ်သော မက်ထရစ်ကို အသုံးပြု၍ multicollinearity ကို ရှာဖွေတွေ့ရှိနိုင်သည်။

Stata ရှိ ဆုတ်ယုတ်မှုဆိုင်ရာ ခွဲခြမ်းစိတ်ဖြာမှုတွင် ကော်လိုင်းပေါင်းစုံကို သိရှိရန် VIF ကိုအသုံးပြုပုံကို ဤသင်ခန်းစာတွင် ရှင်းပြထားသည်။

ဥပမာ- Stata တွင် ကော်လိုင်းပေါင်းစုံရှိမှု

ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် auto ဟုခေါ်သော Stata ၏ built-in ဒေတာအတွဲကို အသုံးပြုပါမည်။ ဒေတာအတွဲကို တင်ရန် အောက်ပါ command ကို သုံးပါ။

အလိုအလျောက်အသုံးပြုပါ။

တုံ့ပြန်မှု variable နှင့် အလေးချိန်၊ အလျားနှင့် mpg တို့ကို ရှင်းပြထားသော ကိန်းရှင်များအဖြစ် စျေးနှုန်းဖြင့် အမျိုးမျိုးသော linear regression model တစ်ခုနှင့် ကိုက်ညီရန် regress command ကို အသုံးပြုပါမည်။

regression price အလေးချိန် အရှည် စိုင်းစိုင်းခမ်းလှိုင်

Stata တွင် linear regression output အများအပြား

ထို့နောက်၊ ကျွန်ုပ်တို့သည် multicollinearity ကိုစမ်းသပ်ရန် vive command ကိုသုံးပါမည်။

အသက်ဝင်သည်။

Stata တွင် VIF

၎င်းသည် မော်ဒယ်ရှိ ရှင်းပြချက်တစ်ခုစီအတွက် VIF တန်ဖိုးကို ထုတ်ပေးသည်။ VIF တန်ဖိုးသည် 1 မှစတင်ပြီး အထက်ကန့်သတ်ချက်မရှိပါ။ VIF များကို ဘာသာပြန်ရန်အတွက် ယေဘူယျစည်းမျဉ်းမှာ-

  • 1 ၏တန်ဖိုးသည် ပေးထားသောရှင်းပြချက်ကိန်းရှင်တစ်ခုနှင့် မော်ဒယ်ရှိ အခြားရှင်းပြကိန်းရှင်ကြားတွင် ဆက်စပ်မှုမရှိဟု ဖော်ပြသည်။
  • 1 နှင့် 5 အကြားတန်ဖိုးသည် ပေးထားသောရှင်းပြချက်ကိန်းရှင်တစ်ခုနှင့် မော်ဒယ်ရှိ အခြားရှင်းပြကိန်းရှင်များကြားတွင် အလယ်အလတ်ဆက်စပ်မှုကို ညွှန်ပြသော်လည်း အထူးသတိထားရန် လိုအပ်လောက်အောင် မပြင်းထန်ပါ။
  • 5 ထက်ကြီးသောတန်ဖိုးသည် ပေးထားသောရှင်းပြချက်ကိန်းရှင်နှင့် မော်ဒယ်ရှိ အခြားရှင်းပြကိန်းရှင်များအကြား ပြင်းထန်စွာဆက်စပ်မှုကို ညွှန်ပြသည်။ ဤကိစ္စတွင်၊ ဆုတ်ယုတ်မှုရလဒ်များတွင် ကိန်းဂဏန်းခန့်မှန်းချက်များနှင့် p-တန်ဖိုးများသည် ယုံကြည်စိတ်ချရဖွယ်မရှိပေ။

အလေးချိန်နှင့် အလျားအတွက် VIF တန်ဖိုးများသည် 5 ထက် ပိုများသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊၊ multicollinearity သည် regression model တွင် ပြဿနာတစ်ခုဖြစ်နိုင်သည်ဟု ညွှန်ပြပါသည်။

Multicollinearity ကို ဘယ်လိုကိုင်တွယ်မလဲ။

Multicollinearity ကို ကိုင်တွယ်ရန် အလွယ်ဆုံးနည်းလမ်းမှာ ပြဿနာ variable များထဲမှ တစ်ခုကို ဖယ်ရှားရန်ဖြစ်ပြီး၊ သင်ဖယ်ရှားနေသော variable သည် မည်သို့ပင်ဖြစ်စေ မလိုအပ်တော့ဘဲ မော်ဒယ်သို့ ထူးခြားသော သို့မဟုတ် အမှီအခိုကင်းသော အချက်အလက်အနည်းငယ်ကို ပေါင်းထည့်သောကြောင့် ဖြစ်သည်။

မည်သည့် variable များကို ဖယ်ရှားရမည်ကို ဆုံးဖြတ်ရန်အတွက်၊ ကျွန်ုပ်တို့သည် model ရှိ variable တစ်ခုစီကြားရှိ ဆက်စပ်ကိန်းများကို ပြသရန် corr command ကိုအသုံးပြု၍ corr command ကိုအသုံးပြု၍ model ရှိ variable တစ်ခုစီ၏ correlation coefficients ကိုပြသရန်၊ Multicollinearity ပြဿနာ-

corr ဈေးနှုန်း အလေးချိန် အရှည် စိုင်းစိုင်းခမ်းလှိုင်

Stata ရှိ ဆက်စပ်မက်ထရစ်

အရှည်သည် အလေးချိန်နှင့် mpg နှစ်ခုလုံးနှင့် အလွန်ဆက်စပ်နေကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပြီး၊ တုံ့ပြန်မှုပြောင်းလဲနိုင်သောစျေးနှုန်းနှင့် အနိမ့်ဆုံးဆက်စပ်မှုရှိသည်။ ထို့ကြောင့်၊ မော်ဒယ်အလျားကို ဖယ်ရှားခြင်းသည် ဆုတ်ယုတ်မှုမော်ဒယ်၏ အလုံးစုံအရည်အသွေးကို လျှော့ချခြင်းမရှိဘဲ multicollinearity ပြဿနာကို ဖြေရှင်းနိုင်သည်။

၎င်းကို စမ်းသပ်ရန်အတွက်၊ အလေးချိန်နှင့် mpg တို့ကို ရှင်းပြထားသော ကိန်းရှင်များအဖြစ် အသုံးပြု၍ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုကို ထပ်မံလုပ်ဆောင်နိုင်သည်-

regression price စိုင်းစိုင်းခမ်းလှိုင် အလေးချိန်

Stata တွင် linear regression output အများအပြား

ဤမော်ဒယ်၏ ချိန်ညှိထားသော R-squared သည် ယခင်မော်ဒယ်ရှိ 0.3298 နှင့် နှိုင်းယှဉ်ပါက 0.2735 ဖြစ်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ ၎င်းသည် မော်ဒယ်၏ အလုံးစုံ အသုံးဝင်မှု အနည်းငယ်သာ လျော့နည်းသွားကြောင်း ညွှန်ပြသည်။ ထို့နောက် VIF အမိန့်ကို အသုံးပြု၍ VIF တန်ဖိုးများကို ကျွန်ုပ်တို့ ရှာဖွေနိုင်သည်-

သွက်လက်သည်။

Stata တွင် VIF တန်ဖိုးများ

VIF တန်ဖိုးနှစ်ခုလုံးသည် 5 ထက်နည်းသောကြောင့် multicollinearity သည် model တွင်ပြဿနာမရှိတော့ကြောင်းဖော်ပြသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်