တစ်ပြေးညီ ဆုတ်ယုတ်မှု
ဤဆောင်းပါးတွင် linear regression သည် အဘယ်အရာနှင့် ၎င်းကို ကိန်းဂဏန်းများအတွက် အသုံးပြုကြောင်း ရှင်းပြထားသည်။ ထို့အပြင်၊ linear regression အမျိုးအစား နှစ်ခုကို မည်ကဲ့သို့ တွက်ချက်ထားသည်- ရိုးရှင်းသော linear regression နှင့် multiple linear regression ကို သင်တွေ့မြင်နိုင်မည်ဖြစ်ပါသည်။
linear regression ဆိုတာ ဘာလဲ။
Linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော အမှီအခိုကင်းသော variable များကို မှီခိုသော variable နှင့် ဆက်စပ်နေသော ကိန်းဂဏန်းစံနမူနာတစ်ခုဖြစ်သည်။ ရိုးရိုးရှင်းရှင်းပြောရလျှင် linear regression သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော explanatory variables နှင့် response variable အကြား ဆက်နွယ်မှုကို ခန့်မှန်းသည့် ညီမျှခြင်းတစ်ခုကို ရှာဖွေရန် အသုံးပြုသည့် နည်းလမ်းတစ်ခုဖြစ်သည်။
ဥပမာအားဖြင့်၊ ညီမျှခြင်း y=2+5x 1 -3x 2 +8x 3 သည် အမှီအခိုကင်းသော variable သုံးခု (x 1 , x 2 , x 3 ) တို့ကို သင်္ချာနည်းအရ ဆက်စပ်ကိန်းရှင် (y) နှင့် ဆက်နွယ်နေသောကြောင့်၊ variable များကြား ဆက်စပ်မှုသည် linear ဖြစ်သည်။
Linear Regression အမျိုးအစားများ
linear regression ဟူ၍ နှစ်မျိုးရှိ သည်။
- ရိုးရှင်းသော linear regression : အမှီအခိုကင်းသော ကိန်းရှင်တစ်ခုသည် မှီခိုကိန်းရှင်တစ်ခုနှင့် ချိတ်ဆက်ထားသည်။ ဤမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံအတွက် ညီမျှခြင်းသည် y=β 0 +β 1 x 1 ပုံစံဖြစ်သည်။
- Multiple linear regression : regression model တွင် ရှင်းလင်းချက်ပြောင်းနိုင်သော variable များနှင့် တုံ့ပြန်မှု variable များစွာရှိသည်။ ထို့ကြောင့်၊ ဤမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ၏ ညီမျှခြင်းသည် y=β 0 +β 1 x 1 +β 2 x 2 …+β m x m ပုံစံဖြစ်သည်။
ရိုးရှင်းသော linear ဆုတ်ယုတ်မှု
ရိုးရှင်းသော linear regression ကို variable နှစ်ခုလုံးနှင့် သီးခြားလွတ်လပ်သော variable တစ်ခုကို ဆက်စပ်ရန် အသုံးပြုသည်။
ရိုးရှင်းသော linear regression model ၏ ညီမျှခြင်းသည် မျဉ်းဖြောင့်ဖြစ်ပြီး၊ ထို့ကြောင့် ၎င်းကို coefficients နှစ်ခုဖြင့် ဖွဲ့စည်းထားသည်- ညီမျှခြင်း (β 0 ) နှင့် variable နှစ်ခုကြားရှိ ဆက်စပ်ကိန်း (β 1 )။ ထို့ကြောင့်၊ ရိုးရှင်းသော linear regression model အတွက် ညီမျှခြင်းမှာ y=β 0 +β 1 x ဖြစ်သည်။
ရိုးရှင်းသော linear regression coefficients များကို တွက်ချက်ရန်အတွက် ဖော်မြူလာများမှာ အောက်ပါအတိုင်းဖြစ်သည် ။
ရွှေ-
-
regression line ၏ ကိန်းသေဖြစ်ပါသည်။
-
regression line ၏ slope ဖြစ်သည်။
-
ဒေတာ i ၏ လွတ်လပ်သော ကိန်းရှင် X ၏ တန်ဖိုးဖြစ်သည်။
-
ဒေတာ i ၏ မှီခို variable Y ၏ တန်ဖိုးဖြစ်သည်။
-
လွတ်လပ်သော variable ၏ပျမ်းမျှတန်ဖိုးများဖြစ်သည်။
-
dependent variable Y ၏ ပျမ်းမျှတန်ဖိုးများဖြစ်သည်။
မျဉ်းကြောင်း ဆုတ်ယုတ်မှု အများအပြား
Multiple linear regression model တစ်ခုတွင်၊ အနည်းဆုံး သီးခြားသော ကိန်းရှင်နှစ်ခု ပါဝင်ပါသည်။ တစ်နည်းဆိုရသော် Multiple linear regression သည် များစွာသော explanatory variable များကို တုံ့ပြန်မှု variable နှင့် linearly ချိတ်ဆက်နိုင်စေပါသည်။
Multiple linear regression model အတွက် ညီမျှခြင်းမှာ y=β 0 +β 1 x 1 +β 2 x 2 +…+β m x m +ε ဖြစ်သည်။
ရွှေ-
-
dependent variable ဖြစ်ပါတယ်။
-
လွတ်လပ်သော ကိန်းရှင် i ဖြစ်သည် ။
-
Multiple linear regression equation ၏ ကိန်းသေဖြစ်ပါသည်။
-
ကိန်းရှင်နှင့်ဆက်စပ်နေသော ဆုတ်ယုတ်မှုကိန်းဂဏန်းဖြစ်သည်။
.
-
error သို့မဟုတ် residual ဖြစ်သည်၊ ဆိုလိုသည်မှာ သတိပြုမိသောတန်ဖိုးနှင့် မော်ဒယ်မှ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ကို ဆိုလိုသည်။
-
မော်ဒယ်ရှိ ကိန်းရှင်များ စုစုပေါင်း အရေအတွက် ဖြစ်ပါသည်။
ဒီတော့ စုစုပေါင်းနမူနာတစ်ခုရရင်
လေ့လာချက်များအရ၊ ကျွန်ုပ်တို့သည် မျဉ်းကြောင်းကြောင်း ဆုတ်ယုတ်မှုပုံစံကို မက်ထရစ်ပုံစံဖြင့် ပုံဖော်နိုင်သည်-
အထက်ဖော်ပြပါ မက်ထရစ်အသုံးအနှုန်းကို မက်ထရစ်တစ်ခုစီသို့ စာလုံးတစ်လုံးစီ သတ်မှတ်ခြင်းဖြင့် ပြန်လည်ရေးသားနိုင်သည်-
ထို့ကြောင့်၊ အနည်းဆုံး စတုရန်းစံသတ်မှတ်ချက်ကို ကျင့်သုံးခြင်းဖြင့်၊ များစွာသော မျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ၏ ကိန်းဂဏန်းများကို ခန့်မှန်းရန် ဖော်မြူလာ သို့ ကျွန်ုပ်တို့ ရောက်ရှိနိုင်သည်-
သို့သော်၊ ဤဖော်မြူလာ၏အသုံးချမှုသည် အလွန်ပင်ပန်းပြီး အချိန်ကုန်သောကြောင့် လက်တွေ့တွင် Multiple regression model ကိုပိုမိုလျင်မြန်စွာဖန်တီးနိုင်သည့် ကွန်ပျူတာဆော့ဖ်ဝဲ (ဥပမာ Minitab သို့မဟုတ် Excel) ကို အသုံးပြုရန် အကြံပြုထားသည်။
Linear Regression ယူဆချက်
linear regression model တွင်၊ model မှန်ကန်စေရန်အတွက် အောက်ပါအခြေအနေများနှင့် ကိုက်ညီရမည်-
- လွတ်လပ်ရေး – အကြွင်းအကျန်များသည် တစ်ခုနှင့်တစ်ခု အမှီအခိုကင်းရမည်။ စံပြလွတ်လပ်မှုကို သေချာစေရန် ဘုံနည်းလမ်းမှာ နမူနာကောက်ယူခြင်းလုပ်ငန်းစဉ်တွင် ကျပန်းထည့်သွင်းခြင်းဖြစ်ပါသည်။
- Homoscedasticity : အကြွင်းအကျန်များ၏ ကွဲလွဲမှုများတွင် တူညီမှုရှိရမည်၊ ဆိုလိုသည်မှာ အကြွင်းအကျန်များ၏ ကွဲလွဲမှုမှာ စဉ်ဆက်မပြတ်ရှိနေရမည်ဖြစ်သည်။
- Multicollinearity မဟုတ်သော- မော်ဒယ်တွင်ပါရှိသော ရှင်းလင်းချက် ကိန်းရှင်များသည် တစ်ခုနှင့်တစ်ခု ချိတ်ဆက်၍မရပါ သို့မဟုတ် အနည်းဆုံး ၎င်းတို့၏ဆက်ဆံရေးသည် အလွန်အားနည်းနေရပါမည်။
- Normality : ကျန်ရှိသောပစ္စည်းများကို ပုံမှန်ဖြန့်ဝေရပါမည် သို့မဟုတ် တစ်နည်းအားဖြင့်ဆိုလိုရင်း 0 ဖြင့် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း လုပ်ဆောင်ရမည်ဖြစ်သည်။
- Linearity : တုံ့ပြန်မှု variable နှင့် explanatory variables အကြား ဆက်နွယ်မှုသည် linear ဖြစ်သည်ဟု ယူဆပါသည်။
linear regression ကို ဘာအတွက်အသုံးပြုသလဲ။
Linear regression တွင် အခြေခံအားဖြင့် အသုံးပြုမှု နှစ်ခုရှိသည်- Linear regression ကို explanatory variables နှင့် response variable အကြား ဆက်နွယ်မှုကို ရှင်းပြရန် အသုံးပြုပြီး အလားတူ၊ linear regression ကို လေ့လာမှုအသစ်အတွက် dependent variable ၏တန်ဖိုးကို ခန့်မှန်းရန် အသုံးပြုပါသည်။
linear regression model ၏ ညီမျှခြင်းကို ရယူခြင်းဖြင့်၊ model ရှိ variables များကြားတွင် ဆက်စပ်မှု အမျိုးအစားကို သိရှိနိုင်ပါသည်။ အမှီအခိုကင်းသော ကိန်းရှင်တစ်ခု၏ ဆုတ်ယုတ်မှုကိန်းဂဏန်းသည် အပေါင်းလက္ခဏာဖြစ်ပါက၊ မှီခိုကိန်းရှင်သည် တိုးလာသောအခါတွင် တိုးလာမည်ဖြစ်သည်။ အမှီအခိုကင်းသောကိန်းရှင်တစ်ခု၏ ဆုတ်ယုတ်မှုကိန်းဂဏန်းသည် အနုတ်ဖြစ်နေပါက၊ မှီခိုကိန်းရှင်သည် တိုးလာသောအခါ လျော့နည်းသွားမည်ဖြစ်သည်။
တစ်ဖက်တွင်၊ linear regression တွင် တွက်ချက်ထားသော equation သည် value ခန့်မှန်းချက်များကို ပြုလုပ်နိုင်သည်။ ထို့ကြောင့်၊ စံပြညီမျှခြင်းသို့ explanatory variable များ၏ တန်ဖိုးများကို မိတ်ဆက်ပေးခြင်းဖြင့် data အသစ်တစ်ခုအတွက် dependent variable ၏တန်ဖိုးကို တွက်ချက်နိုင်ပါသည်။