Regression analysis တွင် heteroscedasticity ကို နားလည်ခြင်း။


ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုတွင်၊ heteroskedasticity (တစ်ခါတစ်ရံ စာလုံးပေါင်း heteroskedasticity) သည် အကြွင်းအကျန်များ သို့မဟုတ် အမှားအယွင်းများ ၏ မညီမျှသော ကွဲလွဲမှုကို ရည်ညွှန်းသည်။ ပို၍တိကျသည်မှာ၊ ဤသည်မှာ တိုင်းတာထားသောတန်ဖိုးများ၏ အကွာအဝေးထက် အကြွင်းအကျန်များ ဖြန့်ဖြူးရာတွင် စနစ်တကျ အပြောင်းအလဲရှိနေသည့် ကိစ္စဖြစ်သည်။

Heteroskedasticity သည် သာမာန်အနည်းဆုံးစတုရန်းများ (OLS) ဆုတ်ယုတ်မှုမှ အကြွင်းအကျန်များသည် မျိုးတူရိုးကျ ဖြစ်သော လူဦးရေမှ ဆင်းသက်လာသည်ဟု ယူဆသောကြောင့်၊ အဆက်မပြတ်ကွဲလွဲမှုဟု ဆိုလိုသည်။

ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုတွင် မျိုးကွဲကွဲပြားမှု ရှိနေသောအခါ၊ ခွဲခြမ်းစိတ်ဖြာမှု၏ ရလဒ်များသည် ယုံကြည်ရန် ခက်ခဲလာသည်။ အထူးသဖြင့်၊ heteroskedasticity သည် regression coefficient ခန့် မှန်းချက်များ၏ ကွဲလွဲမှုကို တိုးစေသည်၊ သို့သော် regression model သည် ၎င်းအတွက် ထည့်မတွက်ပါ။

၎င်းသည် ဆုတ်ယုတ်မှုပုံစံသည် မော်ဒယ်ရှိ ကိန်းဂဏာန်းတစ်ခုသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်ဟု ဆိုနိုင်သည်၊ လက်တွေ့တွင် ၎င်းမဟုတ်သည့်အခါတွင် ပို၍ဖြစ်နိုင်ချေရှိသည်။

ဤကျူတိုရီရယ်တွင် မျိုးကွဲကွဲပြားမှုကို သိရှိနိုင်ပုံ ၊ မျိုးကွဲဖြစ်ပေါ်ခြင်း၏ အကြောင်းရင်းများနှင့် မျိုးကွဲခြင်းပြဿနာကို ဖြေရှင်းရန် ဖြစ်နိုင်ခြေနည်းလမ်းများကို ရှင်းပြထားသည်။

မျိုးကွဲကွဲပြားမှုကို မည်သို့သိရှိနိုင်မည်နည်း။

heteroskedasticity ကိုရှာဖွေရန် အရိုးရှင်းဆုံးနည်းလမ်းမှာ တပ်ဆင်ထားသောတန်ဖိုး/ကျန်ရှိသောကွက်ကွက်ကို အသုံးပြုခြင်းဖြစ်သည်။

သင်သည် ဒေတာအစုတစ်ခုနှင့် ဆုတ်ယုတ်မှုမျဉ်းကို အံဝင်ခွင်ကျဖြစ်စေပြီးသည်နှင့် အဆိုပါ တပ်ဆင်ထားသော တန်ဖိုးများ၏ အကြွင်းအကျန်များနှင့် မော်ဒယ်၏ တပ်ဆင်ထားသော တန်ဖိုးများကို ပြသသည့် အပိုင်းအစတစ်ခုကို ဖန်တီးနိုင်သည်။

အောက်ဖော်ပြပါ ခွဲခြမ်းစိတ်ဖြာချက် သည် သမရိုးကျတန်ဖိုး၏ ကွက်ကွက်ကို ပြသသည်

တပ်ဆင်ထားသော တန်ဖိုးများ တိုးလာသည်နှင့်အမျှ ကျန်အကြွင်းအကျန်များသည် မည်ကဲ့သို့ ပိုမိုပျံ့နှံ့လာသည်ကို သတိပြုပါ။ ဤ “ပုံး” ပုံသဏ္ဍာန်သည် မျိုးရိုးလိုက်ခြင်း၏ ထင်ရှားသော လက္ခဏာတစ်ခုဖြစ်သည်။

မျိုးရိုးလိုက်ခြင်း၏ အကြောင်းတရားများကား အဘယ်နည်း။

ဒေတာတန်ဖိုးများ ကျယ်ပြန့်စွာရှိနေသည့် ဒေတာအတွဲများတွင် မျိုးရိုးလိုက်ခြင်းမှာ သဘာဝအတိုင်း ဖြစ်ပေါ်ပါသည်။ ဥပမာအားဖြင့်:

  • အမေရိကန်ပြည်ထောင်စုရှိ လူ 100,000 တစ်နှစ်ဝင်ငွေနှင့် အသုံးစရိတ်များ အပါအဝင် ဒေတာအစုံကို သုံးသပ်ကြည့်ပါ။ ဝင်ငွေနည်းသောသူများအတွက်၊ သက်ဆိုင်သောအသုံးစရိတ်များ၏ ကွဲလွဲမှု နည်းပါးသွားမည်ဖြစ်ပြီး၊ အကြောင်းမှာ အဆိုပါလူများသည် လိုအပ်သည်များအတွက် ပေးချေရန် ငွေအလုံအလောက်ရှိနိုင်သောကြောင့်ဖြစ်သည်။ ဝင်ငွေများသော ပုဂ္ဂိုလ်များအတွက်၊ ဤပုဂ္ဂိုလ်များသည် ၎င်းတို့ဆန္ဒရှိလျှင် သုံးစွဲရန်ငွေ ပိုရှိမည်ဖြစ်သောကြောင့် ဆက်စပ်အသုံးစရိတ်များတွင် အပြောင်းအလဲများ ပိုမိုရှိလာမည်ဖြစ်သည်။ ဝင်ငွေမြင့်သူအချို့သည် ၎င်းတို့၏ ၀င်ငွေအများစုကို သုံးစွဲရန် ရွေးချယ်ကြပြီး အချို့မှာ ချွေတာတတ်ကာ အပိုင်းတစ်ပိုင်းသာ သုံးစွဲမည်ဖြစ်သည်။ ထို့ကြောင့် ဤဝင်ငွေမြင့်သူများကြားတွင် သုံးစွဲမှု ကွဲပြားမှုမှာ မူလအားဖြင့် ပိုများမည်ဖြစ်သည်။
  • အမေရိကန်ပြည်ထောင်စုရှိ မတူညီသောမြို့ပေါင်း 1,000 ရှိ လူဦးရေနှင့် ပန်းဆရာအရေအတွက် ပါဝင်သော ဒေတာအစုံကို သုံးသပ်ကြည့်ပါ။ လူဦးရေကျဲပါးသောမြို့များတွင် ပန်းသမားတစ်ဦး သို့မဟုတ် နှစ်ဦးသာရှိနေခြင်းသည် သာမာန်ဖြစ်နိုင်သည်။ သို့သော် လူနေထူထပ်သော မြို့ကြီးများတွင်မူ ပန်းဆရာအရေအတွက်သည် ပို၍ပြောင်းလဲလာမည်ဖြစ်သည်။ ဤမြို့များတွင် စတိုးဆိုင် 10 မှ 100 ကြားရှိနိုင်သည်။ ဆိုလိုသည်မှာ ကျွန်ုပ်တို့သည် ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုကို ဖန်တီးပြီး ပန်းဆရာအရေအတွက်ကို ခန့်မှန်းရန် လူဦးရေကို အသုံးပြုသောအခါ၊ လူဦးရေပိုများသော မြို့များအတွက် အကြွင်းအကျန်များတွင် မူလအားဖြင့် ကွဲပြားမှုများ ပိုမိုရှိလာမည်ကို ဆိုလိုပါသည်။

အချို့သော ဒေတာအတွဲများသည် အခြားအရာများထက် မျိုးရိုးလိုက်နိုင်ခြေပိုများသည်။

Heteroscedasticity ကို ဘယ်လိုပြင်မလဲ။

heteroskedasticity အတွက် ပြင်ရန် ဘုံသုံးနည်း ရှိပါသည်။

1. မှီခိုသော ကိန်းရှင်ကို ပြောင်းလဲပါ။

heteroskedasticity အတွက် ပြုပြင်ရန် နည်းလမ်းတစ်ခုမှာ မှီခို variable ကို တစ်နည်းနည်းဖြင့် ပြောင်းလဲရန် ဖြစ်သည်။ ယေဘူယျအသွင်ပြောင်းခြင်းသည် မှီခိုကိန်းရှင်၏ မှတ်တမ်းကို ရိုးရိုးရှင်းရှင်းယူရန်ဖြစ်သည်။

ဥပမာအားဖြင့်၊ အကယ်၍ ကျွန်ုပ်တို့သည် မြို့တစ်မြို့ရှိ ပန်းရောင်းသူအရေအတွက်ကို ခန့်မှန်းရန် လူဦးရေအရွယ်အစား (အမှီအခိုကင်းသော ကိန်းရှင်) ကို အသုံးပြုပါက၊ မြို့တစ်မြို့ရှိ ပန်းရောင်းသူအရေအတွက်၏ လော့ဂရစ်သမ်ကို ခန့်မှန်းရန် လူဦးရေအရွယ်အစားကို အသုံးပြု၍ ကြိုးစားနိုင်သည်။

မူလမှီခိုကိန်းရှင်ထက် မှီခိုကိန်းရှင်၏ မှတ်တမ်းကို အသုံးပြုခြင်းဖြင့် မကြာခဏ ကွဲပြားမှု ပျောက်ကွယ်သွားနိုင်သည်။

2. မှီခိုသောကိန်းရှင်ကို ပြန်လည်သတ်မှတ်ပါ။

heteroskedasticity ကိုပြင်ရန်နောက်ထပ်နည်းလမ်းမှာမှီခိုကိန်းရှင်ကိုပြန်လည်သတ်မှတ်ရန်ဖြစ်သည်။ ၎င်းကိုပြုလုပ်ရန် ဘုံနည်းလမ်းမှာ ကုန်ကြမ်းတန်ဖိုးထက် မှီခိုကိန်းရှင်အတွက် နှုန်းထားကို အသုံးပြုခြင်းဖြစ်သည်။

ဥပမာအားဖြင့်၊ မြို့တွင်းရှိ ပန်းဆရာအရေအတွက်ကို ခန့်မှန်းရန် လူဦးရေအရွယ်အစားကို အသုံးပြုမည့်အစား၊ တစ်ဦးချင်းအလိုက် ပန်းဆရာအရေအတွက်ကို ခန့်မှန်းရန် လူဦးရေအရွယ်အစားကို အသုံးပြုနိုင်သည်။

ကိစ္စအများစုတွင်၊ ကျွန်ုပ်တို့သည် ပန်းသမားအရေအတွက်ထက် လူတစ်ဦးလျှင် ပန်းဆရာအရေအတွက်ကို တိုင်းတာနေသောကြောင့် ပိုမိုကြီးမားသောလူဦးရေအတွင်း သဘာဝအတိုင်းဖြစ်ပေါ်သည့် ကွဲပြားမှုကို လျော့နည်းစေသည်။

3. အလေးချိန် ဆုတ်ယုတ်မှုကို သုံးပါ။

heteroskedasticity အတွက် ပြင်ရန် နောက်တစ်နည်းမှာ weighted regression ကို အသုံးပြုခြင်း ဖြစ်သည်။ ဤဆုတ်ယုတ်မှုအမျိုးအစားသည် ၎င်း၏တပ်ဆင်ထားသောတန်ဖိုး၏ကွဲလွဲမှုအပေါ်အခြေခံ၍ ဒေတာအမှတ်တစ်ခုစီအား အလေးချိန်တစ်ခုစီပေးသည်။

အခြေခံအားဖြင့်၊ ၎င်းသည် ၎င်းတို့ကျန်ရှိသော စတုရန်းများကို လျှော့ချပြီး ကွဲပြားမှုများ ပိုမိုမြင့်မားသည့် ဒေတာအမှတ်များကို နည်းပါးစေသည်။ သင့်လျော်သောအလေးချိန်ကိုအသုံးပြုသောအခါ၊ ၎င်းသည် heteroskedasticity ပြဿနာကိုဖယ်ရှားနိုင်သည်။

နိဂုံး

Heteroscedasticity သည် ဒေတာအစုများစွာသည် မူလရင်းမြစ်အတိုင်း အဆက်မပြတ်ကွဲလွဲနေသောကြောင့် ဆုတ်ယုတ်ခြင်းဆိုင်ရာ ခွဲခြမ်းစိတ်ဖြာမှုတွင် မျှမျှတတဖြစ်လေ့ရှိသော ပြဿနာတစ်ခုဖြစ်သည်။

သို့ရာတွင်၊ ကျန်ရှိသောကွက်ကွက်တစ်ခုနှင့် အံဝင်ခွင်ကျတန်ဖိုးကွက်ကွက်ကို အသုံးပြုခြင်းဖြင့်၊ အမျိုးအစားကွဲကွဲပြားမှုကို သိမြင်ရန် အလွန်လွယ်ကူပါသည်။

မှီခိုကိန်းရှင်ကို ပြောင်းလဲခြင်း၊ မှီခိုကိန်းရှင်ကို ပြန်လည်သတ်မှတ်ခြင်း သို့မဟုတ် အလေးချိန်ရှိသော ဆုတ်ယုတ်ခြင်းတို့ကို အသုံးပြုခြင်းဖြင့်၊ heteroskedasticity ပြဿနာကို မကြာခဏ ဖယ်ရှားပစ်နိုင်သည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်