Linear regression ၏ ယူဆချက်လေးခု


linear regression သည် x နှင့် y နှစ်ခုကြားရှိ ဆက်နွယ်မှုကို နားလည်ရန် အသုံးဝင်သော စာရင်းအင်းနည်းလမ်းတစ်ခုဖြစ်သည်။ သို့သော်လည်း၊ မျဉ်းကြောင်းပြန်ဆုတ်ခြင်းကို မလုပ်ဆောင်မီ၊ ကျွန်ုပ်တို့သည် ယူဆချက်လေးခုနှင့် ကိုက်ညီကြောင်း ဦးစွာသေချာစေရပါမည်။

1. Linear ဆက်ဆံရေး- လွတ်လပ်သော variable, x နှင့် dependent variable, y တို့ကြားတွင် linear ဆက်နွယ်မှုရှိပါသည်။

2. လွတ်လပ်ရေး- အကြွင်းအကျန်များသည် သီးခြားဖြစ်သည်။ အထူးသဖြင့်၊ အချိန်စီးရီးဒေတာတွင် တစ်ဆက်တည်းကျန်နေသည့်အရာများကြား ဆက်စပ်မှုမရှိပါ။

3. Homoscedasticity- ကျန်အကြွင်းများသည် x အဆင့်တစ်ခုစီတွင် အဆက်မပြတ်ကွဲလွဲမှုရှိသည်။

4. Normality- မော်ဒယ်အကြွင်းအကျန်များကို ပုံမှန်အတိုင်း ဖြန့်ဝေပါသည်။

အကယ်၍ ဤယူဆချက်များထဲမှ တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ယူဆချက်များနှင့် မကိုက်ညီပါက၊ ကျွန်ုပ်တို့၏ မျဉ်းကြောင်းဆုတ်ယုတ်မှု၏ ရလဒ်များသည် ယုံကြည်စိတ်ချရသော သို့မဟုတ် လွဲမှားခြင်းပင် ဖြစ်နိုင်ပါသည်။

ဤဆောင်းပါးတွင်၊ ယူဆချက်တစ်ခုစီအတွက် ရှင်းလင်းချက်၊ ယူဆချက်နှင့်ကိုက်ညီခြင်းရှိ၊ မရှိ ဆုံးဖြတ်နည်းနှင့် ယူဆချက်မပြည့်မီပါက ဘာလုပ်ရမည်နည်း။

Hypothesis 1- Linear ဆက်ဆံရေး

ရှင်းလင်းချက်

linear regression ၏ ပထမဆုံး ယူဆချက်မှာ လွတ်လပ်သော ကိန်းရှင် x နှင့် အမှီအခိုကင်းသော ကိန်းရှင် y တို့ကြား မျဉ်းကြောင်း ဆက်နွယ်မှု ရှိနေသည်။

ဒီယူဆချက်နဲ့ ကိုက်ညီမှုရှိမရှိ ဘယ်လိုဆုံးဖြတ်မလဲ။

ဤယူဆချက်အား ကျေနပ်မှုရှိမရှိ သိရှိနိုင်စေရန် အရိုးရှင်းဆုံးနည်းလမ်းမှာ x နှင့် y ၏ အပိုင်းအစတစ်ခုကို ဖန်တီးရန်ဖြစ်သည်။ ၎င်းသည် ကိန်းရှင်နှစ်ခုကြားတွင် linear ဆက်နွယ်မှုရှိမရှိကို မြင်သာစွာမြင်နိုင်စေပါသည်။ ကွက်ကွက်ပေါ်ရှိ အမှတ်များသည် မျဉ်းဖြောင့်အတိုင်း တည်ရှိနေပါက၊ ကိန်းရှင်နှစ်ခုကြားတွင် မျဉ်းကြောင်းဆက်နွယ်မှုအချို့ရှိပြီး ဤယူဆချက်နှင့် ကိုက်ညီပါသည်။

ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါ ဂရပ်ရှိ အမှတ်များသည် မျဉ်းဖြောင့်ပေါ်တွင် ကျရောက်နေပုံရပြီး x နှင့် y အကြား မျဉ်းကြောင်းဆက်နွယ်မှုရှိကြောင်း ညွှန်ပြသည်-

သို့သော်၊ အောက်ဖော်ပြပါဂရပ်တွင် x နှင့် y အကြား မျဉ်းဖြောင့်ဆက်နွယ်ပုံမပေါ်ပါ။

ဤဂရပ်တွင် x နှင့် y အကြား ပြတ်သားသော ဆက်နွယ်မှု ရှိပုံရသည်၊ သို့သော် မျဉ်းကြောင်း ဆက်စပ်မှု မဟုတ်ပါ

ဒီယူဆချက်ကို မလေးစားရင် ဘာလုပ်မလဲ။

အကယ်၍ သင်သည် x နှင့် y အတွက် တန်ဖိုးများ၏ ခွဲခြမ်းစိပ်ဖြာမှုတစ်ခုကို ဖန်တီးပြီး ကိန်းရှင်နှစ်ခုကြားတွင် linear ဆက်နွယ်မှု မရှိကြောင်း တွေ့ရှိပါက၊ သင့်တွင် ရွေးချယ်စရာများစွာရှိသည်။

1. အမှီအခိုကင်းသော နှင့်/သို့မဟုတ် မှီခိုသော ကိန်းရှင်သို့ လိုင်းမဟုတ်သောအသွင်ပြောင်းမှုကို အသုံးချပါ။ ယေဘူယျ ဥပမာများတွင် အမှီအခိုကင်းသော နှင့်/သို့မဟုတ် မှီခိုသော ကိန်းရှင်၏ မှတ်တမ်း၊ စတုရန်း အမြစ် သို့မဟုတ် အပြန်အလှန် အသုံးချခြင်း ပါဝင်သည်။

2. မော်ဒယ်သို့ နောက်ထပ် သီးခြား ကိန်းရှင်ကို ထည့်ပါ။ ဥပမာ၊ x နှင့် y ၏ကွက်လပ်တွင် parabolic ပုံသဏ္ဍာန်ရှိပါက၊ X 2 ကို မော်ဒယ်တွင် ထပ်လောင်းလွတ်လပ်သော variable အဖြစ်ထည့်ရန် အဓိပ္ပါယ်ရှိပေမည်။

အယူအဆ ၂- လွတ်လပ်ရေး

ရှင်းလင်းချက်

linear regression ၏နောက်ထပ်ယူဆချက်မှာ ကျန်ရှိသောအရာများသည် သီးခြားဖြစ်သည် ။ အချိန်စီးရီးဒေတာဖြင့် လုပ်ဆောင်သည့်အခါ ၎င်းသည် အထူးသက်ဆိုင်ပါသည်။ အကောင်းဆုံးကတော့၊ ဆက်တိုက်ကျန်နေတဲ့ လမ်းကြောင်းတွေကြားမှာ လမ်းကြောင်းတစ်ခု မဖြစ်စေချင်ပါဘူး။ ဥပမာအားဖြင့်၊ အကြွင်းအကျန်များသည် အချိန်ကြာလာသည်နှင့်အမျှ အဆက်မပြတ်တိုးလာသင့်သည်။

ဒီယူဆချက်နဲ့ ကိုက်ညီမှုရှိမရှိ ဘယ်လိုဆုံးဖြတ်မလဲ။

ဤယူဆချက်သည် အကြွင်းမဲ့အချိန်နှင့်အချိန်နှင့်ယှဉ်သော အကြွင်းအကျန်များဖြစ်သည့် time series ကွက်ကွက်ကို ကြည့်ရှုရန် အရိုးရှင်းဆုံးနည်းလမ်းဖြစ်သည်။ အကောင်းဆုံးအားဖြင့်၊ ကျန်ရှိသော autocorrelation အများစုသည် n ၏ နှစ်ထပ်ကိန်းရင်းမြစ်ပေါ်တွင် ခန့်မှန်းခြေအားဖြင့် +/- 2 တွင်ရှိသော သုညဝန်းကျင်ရှိ ယုံကြည်မှု 95% အတွင်းတွင် ကျရောက်သင့်သည်၊ n သည် နမူနာအရွယ်အစားဖြစ်သည်။ Durbin-Watson စမ်းသပ်မှုကို အသုံးပြု၍ ဤယူဆချက်နှင့်ကိုက်ညီမှုရှိမရှိကိုလည်း တရားဝင်စမ်းသပ်နိုင်သည်။

ဒီယူဆချက်ကို မလေးစားရင် ဘာလုပ်မလဲ။

ဤယူဆချက်ကို မည်ကဲ့သို့ ချိုးဖောက်သည်အပေါ်မူတည်၍ သင့်တွင် ရွေးချယ်စရာများစွာရှိသည်-

  • အပြုသဘောဆောင်သော အမှတ်စဉ်ဆက်နွှယ်မှုအတွက်၊ မော်ဒယ်သို့ မှီခိုမှုနှင့်/သို့မဟုတ် အမှီအခိုကင်းသော ကိန်းရှင်၏ နောက်ကျကျန်နေမှုများကို ထည့်သွင်းစဉ်းစားပါ။
  • အနှုတ်အမှတ်စဉ်ဆက်နွယ်မှုအတွက်၊ သင့် variable များထဲမှ တစ်ခုမျှ နှောင့်နှေးနေမည်မဟုတ်ကြောင်း သေချာပါစေ။
  • ရာသီအလိုက်ဆက်စပ်မှုအတွက်၊ မော်ဒယ်သို့ ရာသီအလိုက်အရုပ်များကို ထည့်စဉ်းစားပါ။

အယူအဆ 3- Homoskedasticity

ရှင်းလင်းချက်

linear regression ၏နောက်ထပ်ယူဆချက်မှာ ကျန်အကြွင်းများသည် x အဆင့်တစ်ခုစီတွင် အဆက်မပြတ်ကွဲလွဲမှုရှိသည်။ ယင်းကို အမျိုးတူချစ်ခြင်း ဟု ခေါ်သည်။ ဒီလိုမှမဟုတ်ရင် ကျန်တဲ့သူတွေဟာ မျိုးကွဲတွေ ကွဲကုန်တယ်။

ဆုတ်ယုတ်မှု ခွဲခြမ်းစိတ်ဖြာမှုတွင် မျိုးကွဲကွဲပြားမှု ရှိနေသောအခါ၊ ခွဲခြမ်းစိတ်ဖြာမှု၏ ရလဒ်များသည် ယုံကြည်ရန် ခက်ခဲလာသည်။ အထူးသဖြင့်၊ heteroskedasticity သည် regression coefficient ခန့် မှန်းချက်များ၏ ကွဲလွဲမှုကို တိုးစေသည်၊ သို့သော် regression model သည် ၎င်းအတွက် ထည့်မတွက်ပါ။ ၎င်းသည် ဆုတ်ယုတ်မှုပုံစံသည် မော်ဒယ်ရှိ ကိန်းဂဏာန်းတစ်ခုသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်ဟု ဆိုနိုင်သည်၊ လက်တွေ့တွင် ၎င်းမဟုတ်သည့်အခါတွင် ပို၍ဖြစ်နိုင်ချေရှိသည်။

ဒီယူဆချက်နဲ့ ကိုက်ညီမှုရှိမရှိ ဘယ်လိုဆုံးဖြတ်မလဲ။

heteroskedasticity ကိုရှာဖွေရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ တပ်ဆင်ထားသော တန်ဖိုး/ကျန်ရှိကွက် တစ်ခုကို ဖန်တီးရန်ဖြစ်သည်။

သင်သည် ဒေတာအစုတစ်ခုနှင့် ဆုတ်ယုတ်မှုမျဉ်းကို အံဝင်ခွင်ကျဖြစ်စေပြီးသည်နှင့် အဆိုပါ တပ်ဆင်ထားသော တန်ဖိုးများ၏ အကြွင်းအကျန်များနှင့် မော်ဒယ်၏ တပ်ဆင်ထားသော တန်ဖိုးများကို ပြသသည့် အပိုင်းအစတစ်ခုကို ဖန်တီးနိုင်သည်။ အောက်ဖော်ပြပါ အပိုင်းအစသည် heteroskedasticity ရှိနေသည့် အကြွင်းနှင့် အံဝင်ခွင်ကျတန်ဖိုး၏ ပုံမှန်ကွက်ကွက်ကို ပြသည်။

တပ်ဆင်ထားသော တန်ဖိုးများ တိုးလာသည်နှင့်အမျှ ကျန်အကြွင်းအကျန်များသည် မည်ကဲ့သို့ ပိုမိုပျံ့နှံ့လာသည်ကို သတိပြုပါ။ ဤ “ပုံး” ပုံသဏ္ဍာန်သည် မျိုးရိုးလိုက်ခြင်း၏ ဂန္တဝင်လက္ခဏာတစ်ရပ်ဖြစ်သည်-

ဒီယူဆချက်ကို မလေးစားရင် ဘာလုပ်မလဲ။

heteroskedasticity အတွက် ပြင်ရန် ဘုံသုံးနည်း ရှိပါသည်။

1. မှီခိုသော ကိန်းရှင်ကို ပြောင်းလဲပါ။ ယေဘူယျအသွင်ပြောင်းခြင်းသည် မှီခိုကိန်းရှင်၏ မှတ်တမ်းကို ရိုးရိုးရှင်းရှင်းယူရန်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ အကယ်၍ ကျွန်ုပ်တို့သည် မြို့တစ်မြို့ရှိ ပန်းရောင်းသူအရေအတွက်ကို ခန့်မှန်းရန် လူဦးရေအရွယ်အစား (အမှီအခိုကင်းသော ကိန်းရှင်) ကို အသုံးပြုပါက၊ မြို့တစ်မြို့ရှိ ပန်းရောင်းသူအရေအတွက်၏ လော့ဂရစ်သမ်ကို ခန့်မှန်းရန် လူဦးရေအရွယ်အစားကို အသုံးပြု၍ ကြိုးစားနိုင်သည်။ မူလမှီခိုကိန်းရှင်ထက် မှီခိုကိန်းရှင်၏ မှတ်တမ်းကို အသုံးပြုခြင်းဖြင့် မကြာခဏ ကွဲပြားမှု ပျောက်ကွယ်သွားနိုင်သည်။

2. မှီခိုသောကိန်းရှင်ကို ပြန်လည်သတ်မှတ်ပါ။ မှီခိုကိန်းရှင်ကို ပြန်လည်သတ်မှတ်ရန် ဘုံနည်းလမ်းမှာ ကုန်ကြမ်းတန်ဖိုးထက် နှုန်းကို အသုံးပြုခြင်းဖြစ်သည်။ ဥပမာအားဖြင့်၊ မြို့တွင်းရှိ ပန်းဆရာအရေအတွက်ကို ခန့်မှန်းရန် လူဦးရေအရွယ်အစားကို အသုံးပြုမည့်အစား၊ တစ်ဦးချင်းအလိုက် ပန်းဆရာအရေအတွက်ကို ခန့်မှန်းရန် လူဦးရေအရွယ်အစားကို အသုံးပြုနိုင်သည်။ ကိစ္စအများစုတွင်၊ ကျွန်ုပ်တို့သည် ပန်းသမားအရေအတွက်ထက် လူတစ်ဦးလျှင် ပန်းဆရာအရေအတွက်ကို တိုင်းတာနေသောကြောင့် ပိုမိုကြီးမားသောလူဦးရေအတွင်း သဘာဝအတိုင်းဖြစ်ပေါ်သည့် ကွဲပြားမှုကို လျော့နည်းစေသည်။

3. အလေးချိန် ဆုတ်ယုတ်မှုကို သုံးပါ။ heteroskedasticity အတွက် ပြင်ရန် နောက်တစ်နည်းမှာ weighted regression ကို အသုံးပြုခြင်း ဖြစ်သည်။ ဤဆုတ်ယုတ်မှုအမျိုးအစားသည် ၎င်း၏တပ်ဆင်ထားသောတန်ဖိုး၏ကွဲလွဲမှုအပေါ်အခြေခံ၍ ဒေတာအမှတ်တစ်ခုစီအား အလေးချိန်တစ်ခုစီပေးသည်။ အခြေခံအားဖြင့်၊ ၎င်းသည် ၎င်းတို့ကျန်ရှိသော စတုရန်းများကို လျှော့ချပြီး ကွဲပြားမှုများ ပိုမိုမြင့်မားသည့် ဒေတာအမှတ်များကို နည်းပါးစေသည်။ သင့်လျော်သောအလေးချိန်ကိုအသုံးပြုသောအခါ၊ ၎င်းသည် heteroskedasticity ပြဿနာကိုဖယ်ရှားနိုင်သည်။

Hypothesis 4- ပုံမှန်အခြေအနေ

ရှင်းလင်းချက်

linear regression ၏နောက်ထပ်ယူဆချက်မှာ ကျန်ရှိသည့်အရာများကို ပုံမှန်အတိုင်း ဖြန့်ဝေခြင်းဖြစ်သည်။

ဒီယူဆချက်နဲ့ ကိုက်ညီမှုရှိမရှိ ဘယ်လိုဆုံးဖြတ်မလဲ။

ဤယူဆချက်အား ကျေနပ်မှုရှိမရှိ စစ်ဆေးရန် ဘုံနည်းလမ်း နှစ်ခုရှိသည်။

1. QQ ကွက်များကို အသုံးပြု၍ အယူအဆကို အမြင်အာရုံဖြင့် စစ်ဆေးပါ

QQ ကွက်ကွက်သည် ပမာဏ-အရေအတွက် အတိုကောက်ဖြစ်ပြီး၊ မော်ဒယ်တစ်ခု၏ အကြွင်းအကျန်များသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း လိုက်နာခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်ရန် ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည့် ကွက်အမျိုးအစားတစ်ခုဖြစ်သည်။ ကွက်ကွက်ပေါ်ရှိ အမှတ်များသည် အကြမ်းဖျင်းအားဖြင့် တည့်တည့် ထောင့်ဖြတ်မျဉ်းများ ဖြစ်ပေါ်လာပါက၊ ပုံမှန်အဖြစ် ယူဆချက်နှင့် ကိုက်ညီပါသည်။

အောက်ဖော်ပြပါ QQ ကွက်ကွက်သည် အကြမ်းဖျင်းအားဖြင့် ပုံမှန်ဖြန့်ဖြူးမှုနောက်ဆက်တွဲဖြစ်သော ကျန်အကြွင်းအကျန်များကို နမူနာပြသည်-

သို့သော်၊ အောက်ဖော်ပြပါ QQ ကွက်ကွက်သည် အကြွင်းအကျန်များသည် ဖြောင့်ထောင့်ဖြတ်မျဉ်းမှ ရှင်းရှင်းလင်းလင်း သွေဖည်သွားသည့် ကိစ္စတစ်ခု၏ ဥပမာကို ပြသထားပြီး ၎င်းတို့သည် ပုံမှန်ဖြန့်ဖြူးမှုကို မလိုက်နာကြောင်း ညွှန်ပြသည်-

2. Shapiro-Wilk၊ Kolmogorov-Smironov၊ Jarque-Barre သို့မဟုတ် D’Agostino-Pearson ကဲ့သို့သော တရားဝင် ကိန်းဂဏန်းစစ်ဆေးမှုများကို အသုံးပြု၍ ပုံမှန်ဖြစ်နေသည်ဟု ယူဆချက်ကိုလည်း စစ်ဆေးနိုင်သည်။ သို့သော်၊ ဤစစ်ဆေးမှုများသည် နမူနာအရွယ်အစားကြီးများအတွက် အထိခိုက်မခံနိုင်ကြောင်း သတိရပါ – ဆိုလိုသည်မှာ၊ သင်၏နမူနာအရွယ်အစားကြီးသောအခါ ကျန်ရှိသည့်အရာများသည် ပုံမှန်မဟုတ်ကြောင်း မကြာခဏ ကောက်ချက်ချလေ့ရှိပါသည်။ ထို့ကြောင့် ဤယူဆချက်အား အတည်ပြုရန် QQ ကြံစည်မှုကဲ့သို့ ဂရပ်ဖစ်နည်းလမ်းများကို ရိုးရှင်းစွာအသုံးပြုရန် မကြာခဏ ပိုမိုလွယ်ကူရခြင်းဖြစ်ပါသည်။

ဒီယူဆချက်ကို မလေးစားရင် ဘာလုပ်မလဲ။

ပုံမှန်ဖြစ်ရိုးဖြစ်စဉ် ယူဆချက်နှင့် မကိုက်ညီပါက၊ သင့်တွင် ရွေးချယ်စရာများစွာရှိသည်။

  • ပထမဦးစွာ၊ ဖြန့်ကျက်မှုအပေါ် ကြီးမားသော အကျိုးသက်ရောက်မှုရှိမရှိ စစ်ဆေးပါ။ အစွန်းအထင်းများရှိပါက၊ ၎င်းတို့သည် စစ်မှန်သောတန်ဖိုးများဖြစ်ပြီး ဒေတာထည့်သွင်းမှုအမှားများမဟုတ်ကြောင်း သေချာပါစေ။
  • ထို့နောက် သင်သည် လွတ်လပ်သော နှင့်/သို့မဟုတ် မှီခိုသော ကိန်းရှင်သို့ လိုင်းမဟုတ်သောအသွင်ပြောင်းမှုကို အသုံးချနိုင်သည်။ ယေဘူယျ ဥပမာများတွင် အမှီအခိုကင်းသော နှင့်/သို့မဟုတ် မှီခိုသော ကိန်းရှင်၏ မှတ်တမ်း၊ စတုရန်း အမြစ် သို့မဟုတ် အပြန်အလှန် အသုံးချခြင်း ပါဝင်သည်။

နောက်ထပ်ဖတ်ရန်:

Simple Linear Regression နိဒါန်း
Regression Analysis တွင် Heteroscedasticity ကို နားလည်ခြင်း။
R တွင် QQ ကွက်ကွက်တစ်ခုကို ဖန်တီးပြီး အဓိပ္ပာယ်ဖွင့်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်