Stata ရှိ ဆုတ်ယုတ်မှုတွင် ခိုင်ခံ့သော စံအမှားများကို မည်သို့အသုံးပြုရမည်နည်း။
Multiple linear regression သည် များစွာသော explanatory variables နှင့် response variable အကြား ဆက်နွယ်မှုကို နားလည်ရန် အသုံးပြုနိုင်သော နည်းလမ်းတစ်ခုဖြစ်သည်။
ကံမကောင်းစွာနဲ့ပဲ၊ ဆုတ်ယုတ်မှုမှာ မကြာခဏဆိုသလို ဖြစ်ပေါ်တတ်တဲ့ ပြဿနာကို heteroscedasticity လို့ ခေါ်တယ်၊ အဲဒီထဲမှာ ကျန်နေတဲ့အရာတွေရဲ့ ကွဲလွဲမှုဟာ တိုင်းတာတဲ့ တန်ဖိုးများစွာရဲ့ အကွာအဝေးထက် စနစ်တကျ ပြောင်းလဲမှုတွေ ရှိပါတယ်။
၎င်းသည် regression coefficient ခန့်မှန်းချက်များ၏ ကွဲလွဲမှုကို တိုးလာစေသည်၊ သို့သော် regression model သည် ၎င်းကို ထည့်သွင်းစဉ်းစားမည်မဟုတ်ပါ။ ၎င်းသည် ဆုတ်ယုတ်မှုပုံစံသည် မော်ဒယ်ရှိ ကိန်းဂဏာန်းတစ်ခုသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်ဟု ဆိုနိုင်သည်၊ လက်တွေ့တွင် ၎င်းမဟုတ်သည့်အခါတွင် ပို၍ဖြစ်နိုင်ချေရှိသည်။
ဤပြဿနာအတွက် စာရင်းရှင်းရန် နည်းလမ်းတစ်ခုမှာ heteroskedasticity ပြဿနာအတွက် ပိုမို “ ခိုင်မာသော” ရှိသော ခိုင်မာသော စံအမှားများကို အသုံးပြုရန်နှင့် regression coefficient ၏ စစ်မှန်သော စံအမှား၏ ပိုမိုတိကျသော တိုင်းတာမှုကို ပေးတတ်သည်။
ဤသင်ခန်းစာသည် Stata ရှိ ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုတွင် ခိုင်ခံ့သောစံအမှားများကို မည်သို့အသုံးပြုရမည်ကို ရှင်းပြထားသည်။
ဥပမာ- Stata ရှိ ခိုင်မာသော စံအမှားများ
ကျွန်ုပ်တို့သည် ဆုတ်ယုတ်မှုတွင် ခိုင်မာသောစံနှုန်းအမှားများကို မည်သို့အသုံးပြုပုံဖော်ပြရန် အလိုအလျောက် ပေါင်းစပ်ထားသော Stata ဒေတာအတွဲကို ကျွန်ုပ်တို့အသုံးပြုပါမည်။
အဆင့် 1: ဒေတာကိုတင်ပြီးပြသပါ။
ပထမဦးစွာ၊ ဒေတာကိုတင်ရန်အောက်ပါ command ကိုအသုံးပြုပါ။
အလိုအလျောက်စနစ်အသုံးပြုခြင်း။
ထို့နောက် အောက်ပါ command ကို အသုံးပြု၍ ဒေတာအကြမ်းကို ပြသပါ။
br
အဆင့် 2- ခိုင်မာသော စံအမှားများမပါဘဲ မျဉ်းကြောင်းအတိုင်း ဆုတ်ယုတ်မှုများစွာကို လုပ်ဆောင်ပါ။
ထို့နောက်၊ တုံ့ပြန်မှု variable နှင့် mpg နှင့် weight ကို explanatory variables အဖြစ် စျေးနှုန်း ကို အသုံးပြု၍ များပြားသော linear regression လုပ်ဆောင်ရန် အောက်ပါ command ကို ရိုက်ထည့်ပါမည်။
regression price စိုင်းစိုင်းခမ်းလှိုင် အလေးချိန်
အဆင့် 3- ခိုင်မာသော စံအမှားများကို အသုံးပြု၍ မျဉ်းကြောင်းအတိုင်း ဆုတ်ယုတ်မှုများစွာကို လုပ်ဆောင်ပါ။
ယခု ကျွန်ုပ်တို့သည် အတိအကျတူညီသောမျဉ်းကြောင်းအတိုင်း ဆုတ်ယုတ်မှုများစွာကို လုပ်ဆောင်ပါမည်၊ သို့သော် ယခုတစ်ကြိမ်တွင် ကျွန်ုပ်တို့သည် vce(robust) command ကိုအသုံးပြု၍ Stata သည် ခိုင်မာသောစံအမှားများကိုမည်သို့အသုံးပြုရမည်ကိုသိစေရန်အတွက်-
ဆုတ်ယုတ်မှုစျေးနှုန်း စိုင်းစိုင်းခမ်းလှိုင် အလေးချိန်၊ vce (ကြံ့ခိုင်)
ဤနေရာတွင် မှတ်သားရန် စိတ်ဝင်စားဖွယ်အချက်အချို့ရှိပါသည်။
1. ကိန်းဂဏန်း ခန့်မှန်းချက်များသည် တူညီနေခဲ့သည် ။ ကျွန်ုပ်တို့သည် ခိုင်မာသောစံနှုန်းအမှားများကို အသုံးပြုသောအခါ၊ ကိန်းဂဏန်းခန့်မှန်းချက်သည် လုံးဝပြောင်းလဲခြင်းမရှိပါ။ စိုင်းစိုင်းခမ်းလှိုင်၊ အလေးချိန်နှင့် ကိန်းသေများအတွက် ကိန်းသေခန့်မှန်းချက်သည် ဆုတ်ယုတ်မှုနှစ်ခုလုံးအတွက် အောက်ပါအတိုင်းဖြစ်ကြောင်း သတိပြုပါ။
- စိုင်းစိုင်းခမ်းလှိုင်: -49.51222
- အလေးချိန် 1.746559
- _aginst: 1946.069
2. စံအမှားများ ပြောင်းလဲသွားပါပြီ ။ ခိုင်မာသော စံအမှားများကို အသုံးပြုသောအခါ၊ ကိန်းဂဏန်း ခန့်မှန်းချက်တစ်ခုစီအတွက် စံအမှားများ တိုးလာသည်ကို သတိပြုပါ။
မှတ်ချက်- ကိစ္စအများစုတွင်၊ ခိုင်ခံ့သောစံအမှားများသည် ပုံမှန်စံအမှားများထက် ပိုကြီးလိမ့်မည်၊ သို့သော် ရှားရှားပါးပါးအခြေအနေများတွင် ခိုင်ခံ့သောစံအမှားများသည် အမှန်တကယ်သေးငယ်သွားလိမ့်မည်ဖြစ်သည်။
3. coefficient တစ်ခုစီ၏ စမ်းသပ်မှု ကိန်းဂဏန်းသည် ပြောင်းလဲသွားပါသည်။ စမ်းသပ်မှုစာရင်းအင်းတစ်ခုစီ၏ ပကတိတန်ဖိုးသည် t ကျဆင်းသွားသည်ကို သတိပြုပါ။ အမှန်မှာ၊ စမ်းသပ်ကိန်းဂဏန်းကို စံအမှားဖြင့် ပိုင်းခြားထားသော ခန့်မှန်းကိန်းကိန်းအဖြစ် တွက်ချက်ပါသည်။ ထို့ကြောင့်၊ standard error ကြီးလေ၊ test statistic ၏ absolute value သေးငယ်လေဖြစ်သည်။
4. p-တန်ဖိုးများ ပြောင်းလဲသွားပါပြီ ။ variable တစ်ခုစီအတွက် p-values များလည်း တိုးလာသည်ကို သတိပြုပါ။ ၎င်းသည် သေးငယ်သော စမ်းသပ်မှုစာရင်းအင်းများသည် ပိုကြီးသော p-တန်ဖိုးများနှင့် ဆက်စပ်နေသောကြောင့်ဖြစ်သည်။
p တန်ဖိုးများသည် ကျွန်ုပ်တို့၏ coefficients အတွက် ပြောင်းလဲသွားသော်လည်း mpg variable သည် α = 0.05 တွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားခြင်းမရှိသေးဘဲ ပြောင်းလဲနိုင်သော အလေးချိန် သည် α = 0.05 တွင် ကိန်းဂဏန်းအရ သိသာထင်ရှားဆဲဖြစ်သည်။