မျဉ်းကြောင်း ဆုတ်ယုတ်မှု အများအပြား
ဤဆောင်းပါးသည် ကိန်းဂဏန်းစာရင်းဇယားများတွင် မျဉ်းကြောင်းမျိုးစုံဆုတ်ယုတ်မှုအကြောင်း ရှင်းပြထားသည်။ ထို့အပြင်၊ Multiple linear regression model ကို ဖန်တီးနည်းနှင့် ၎င်းကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံတို့ကို သင်လေ့လာပါမည်။
Multiple linear regression ဆိုတာ ဘာလဲ။
Multiple linear regression သည် အမှီအခိုကင်းသော variable နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော ဆုတ်ယုတ်မှုပုံစံတစ်ခုဖြစ်သည်။ တစ်နည်းဆိုရသော် Multiple linear regression သည် များစွာသော explanatory variable များကို တုံ့ပြန်မှု variable နှင့် linearly ချိတ်ဆက်နိုင်စေမည့် statistical model တစ်ခုဖြစ်သည်။
ထို့ကြောင့်၊ multiple linear regression model ကို dependent variable တစ်ခုနှင့် နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော အမှီအခိုကင်းသော ကိန်းရှင်များနှင့် ဆက်စပ်နေသည့် ညီမျှခြင်းကို ရှာဖွေရန် အသုံးပြုပါသည်။ ထို့ကြောင့် သီးခြားကိန်းရှင်တစ်ခုစီ၏တန်ဖိုးကို အစားထိုးခြင်းဖြင့်၊ မှီခိုကိန်းရှင်၏တန်ဖိုးကို အနီးစပ်ဆုံးရရှိမည်ဖြစ်သည်။
ဥပမာအားဖြင့်၊ ညီမျှခြင်း y=3+6x 1 -4x 2 +7x 3 သည် များစွာသော linear regression model ဖြစ်ပြီး၊ ၎င်းသည် သီးခြားလွတ်လပ်သော variable သုံးခု (x 1 , x 2 , x 3 ) ကို သင်္ချာနည်းအရ မှီခိုသော variable (y) linear value path တစ်ခုနှင့် ဆက်စပ်နေပါသည်။ .
Multiple Linear Regression Formula
Multiple linear regression model အတွက် ညီမျှခြင်းမှာ y=β 0 +β 1 x 1 +β 2 x 2 +…+β m x m +ε ဖြစ်သည်။
ရွှေ-
-
dependent variable ဖြစ်ပါတယ်။
-
လွတ်လပ်သော ကိန်းရှင် i ဖြစ်သည် ။
-
Multiple linear regression equation ၏ ကိန်းသေဖြစ်ပါသည်။
-
ကိန်းရှင်နှင့်ဆက်စပ်နေသော ဆုတ်ယုတ်မှုကိန်းဂဏန်းဖြစ်သည်။
.
-
၎င်းသည် အမှားအယွင်း သို့မဟုတ် ကျန်ရှိနေသော၊ ဆိုလိုသည်မှာ သတိပြုမိသောတန်ဖိုးနှင့် မော်ဒယ်မှ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ကို ဆိုလိုသည်။
-
မော်ဒယ်ရှိ ကိန်းရှင်များ စုစုပေါင်း အရေအတွက် ဖြစ်ပါသည်။
ဒီတော့ စုစုပေါင်းနမူနာတစ်ခုရရင်
လေ့လာတွေ့ရှိချက်များ၊ ကျွန်ုပ်တို့သည် မျဉ်းကြောင်းဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို မက်ထရစ်ပုံစံဖြင့် အဆိုပြုနိုင်ပါသည်။
အထက်ဖော်ပြပါ array စကားရပ်ကို array တစ်ခုစီသို့ စာလုံးတစ်လုံးစီ သတ်မှတ်ခြင်းဖြင့် ပြန်လည်ရေးသားနိုင်သည်-
ထို့ကြောင့်၊ အနည်းဆုံး စတုရန်းစံသတ်မှတ်ချက်ကို ကျင့်သုံးခြင်းဖြင့်၊ များစွာသော linear regression model တစ်ခု၏ coefficients ကို ခန့်မှန်းရန် ဖော်မြူလာ သို့ ရောက်ရှိနိုင်သည်-
သို့သော်၊ ဤဖော်မြူလာ၏အသုံးချမှုသည် အလွန်ပင်ပန်းပြီး အချိန်ကုန်သောကြောင့် လက်တွေ့တွင် ဆုတ်ယုတ်မှုပုံစံကို ပိုမိုမြန်ဆန်စွာလုပ်ဆောင်နိုင်စေသည့် ကွန်ပျူတာဆော့ဖ်ဝဲ (ဥပမာ Minitab သို့မဟုတ် Excel ကဲ့သို့) ကို အသုံးပြုရန် အကြံပြုထားသည်။
Multiple Linear Regression ယူဆချက်
Multiple linear regression model တစ်ခုတွင်၊ model မှန်ကန်စေရန်အတွက် အောက်ပါအခြေအနေများနှင့် ကိုက်ညီရမည်-
- လွတ်လပ်ရေး : အကြွင်းအကျန်များသည် တစ်ခုနှင့်တစ်ခု အမှီအခိုကင်းရမည်။ စံပြလွတ်လပ်မှုကို သေချာစေရန် ဘုံနည်းလမ်းမှာ နမူနာကောက်ယူခြင်းလုပ်ငန်းစဉ်တွင် ကျပန်းထည့်သွင်းခြင်းဖြစ်ပါသည်။
- Homoscedasticity : အကြွင်းအကျန်များ၏ ကွဲလွဲမှုများတွင် တူညီမှုရှိရမည်၊ ဆိုလိုသည်မှာ အကြွင်းအကျန်များ၏ ကွဲလွဲမှုမှာ စဉ်ဆက်မပြတ်ရှိနေရမည်ဖြစ်သည်။
- Multicollinearity မဟုတ်သော- မော်ဒယ်တွင်ပါရှိသော ရှင်းလင်းချက် ကိန်းရှင်များသည် တစ်ခုနှင့်တစ်ခု ချိတ်ဆက်၍မရပါ သို့မဟုတ် အနည်းဆုံး ၎င်းတို့၏ဆက်ဆံရေးသည် အလွန်အားနည်းနေရပါမည်။
- Normality : ကျန်ရှိသောပစ္စည်းများကို ပုံမှန်ဖြန့်ဝေရပါမည် သို့မဟုတ် တစ်နည်းအားဖြင့်ဆိုလိုရင်း 0 ဖြင့် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း လုပ်ဆောင်ရမည်ဖြစ်သည်။
- Linearity : တုံ့ပြန်မှုကိန်းရှင်နှင့် ရှင်းပြချက်ကိန်းရှင်များကြား ဆက်ဆံရေးသည် မျဉ်းဖြောင့်ဖြစ်သည်ဟု ယူဆပါသည်။
Multiple Linear Regression Model ကို ဘာသာပြန်ခြင်း။
Multiple linear regression model ကိုအနက်ပြန်ဆိုရန်၊ regression model မှရှင်းပြထားသော ရာခိုင်နှုန်းကိုဖော်ပြသည့် coefficient of determination (R squared) ကိုကြည့်ရပါမည်။ ထို့ကြောင့်၊ ဆုံးဖြတ်ခြင်း၏ကိန်းဂဏန်း မြင့်မားလေ၊ လေ့လာထားသော အချက်အလက်နမူနာသို့ စံနမူနာကို ချိန်ညှိနိုင်လေလေ ဖြစ်သည်။
သို့သော်၊ ကိန်းဂဏန်းစံနမူနာတစ်ခု၏ အံဝင်ခွင်ကျကောင်းမှုမှာ အထူးသဖြင့် မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံများ အများအပြားတွင် အထင်မှားစေနိုင်သည်။ အဘယ်ကြောင့်ဆိုသော် ကိန်းရှင်အား မော်ဒယ်သို့ ပေါင်းထည့်သောအခါ၊ ကိန်းရှင်သည် သိသာထင်ရှားခြင်းမရှိသော်လည်း၊ သို့ရာတွင်၊ မော်ဒယ်သည် ရှုပ်ထွေးနည်းပြီး အဓိပ္ပာယ်ဖွင့်ဆိုရန် ပိုမိုလွယ်ကူသောကြောင့် ကိန်းရှင်အရေအတွက်ကို လျှော့ချရန် ကြိုးစားခြင်းဖြင့် အဆုံးအဖြတ်၏ coefficient ကို တိုးမြှင့်ရန် လိုအပ်ပါသည်။
ဤပြဿနာကိုဖြေရှင်းရန်၊ ချိန်ညှိထားသောဆုံးဖြတ်ခြင်းဆိုင်ရာကိန်းဂဏန်း (adjusted R နှစ်ထပ်ကိန်း) သည် ဆုတ်ယုတ်မှုပုံစံ၏ အံဝင်ခွင်ကျအရည်အသွေးကို တိုင်းတာသည့် ကိန်းဂဏန်းကိန်းဂဏန်းတစ်ခုဖြစ်သည့် ချိန်ညှိထားသောဆုံးဖြတ်ခြင်းဆိုင်ရာကိန်းဂဏန်းကို တွက်ချက်ရန် လိုအပ်ပြီး ပြုပြင်မွမ်းမံထားသောကိန်းဂဏန်းများနှင့်မတူဘဲ၊ ဆုံးဖြတ်ချက်။ ၎င်းသည် မော်ဒယ်ရှိ ကိန်းရှင်အရေအတွက်ကို ထည့်သွင်းစဉ်းစားမည်မဟုတ်ပါ။
ထို့ကြောင့်၊ ချိန်ညှိထားသော ကိန်းဂဏန်းသည် ကျွန်ုပ်တို့အား မော်ဒယ်နှစ်ခု၏ အံဝင်ခွင်ကျကောင်းမှုကို မတူညီသောကိန်းရှင်အရေအတွက်များဖြင့် နှိုင်းယှဉ်နိုင်စေပါသည်။ မူအရ၊ သတ်မှတ်နှုန်းပိုမြင့်သော ချိန်ညှိမှုကိန်းဂဏန်းများရှိသည့် မော်ဒယ်ကို ရွေးချယ်သင့်သည်၊ သို့သော် မော်ဒယ်နှစ်ခုတွင် အလွန်တူညီသောတန်ဖိုးများရှိပါက၊ အဓိပ္ပာယ်ဖွင့်ဆိုရလွယ်ကူသောကြောင့် ကိန်းရှင်အနည်းငယ်ပါသော မော်ဒယ်ကို ရွေးချယ်ခြင်းသည် ပိုကောင်းပါသည်။
ဆန့်ကျင်ဘက်အားဖြင့်၊ regression coefficients သည် explanatory variable နှင့် response variable အကြား ဆက်နွယ်မှုကို ဖော်ပြသည်။ regression coefficient သည် positive ဖြစ်ပါက၊ explanatory variable တိုးလာသည်နှင့်အမျှ တုံ့ပြန်မှု variable တိုးလာပါမည်။ regression coefficient သည် negative ဖြစ်ပါက၊ explanatory variable တိုးလာသောအခါတွင် တုံ့ပြန်မှု variable သည် လျော့နည်းသွားမည်ဖြစ်ပါသည်။
ယုတ္တိဗေဒအရ၊ ယခင်အခြေအနေနှင့်ကိုက်ညီရန်၊ အခြားကိန်းရှင်များသည် ကိန်းသေရှိနေရပါမည်။ အဘယ်ကြောင့်ဆိုသော် မော်ဒယ်၏ မတူညီသော ရှင်းပြချက် ကိန်းရှင်များကြားတွင် ပေါင်းစပ်ဖွဲ့စည်းမှု ကွဲပြားမှုမရှိရန် အရေးကြီးပါသည်။ ကျွန်ုပ်တို့၏ ဝဘ်ဆိုက်ရှိ သက်ဆိုင်ရာ ဆောင်းပါးကို ရှာဖွေခြင်းဖြင့် မော်ဒယ်တစ်ခု၏ multicollinearity ကို မည်သို့ လေ့လာသည်ကို သင်ကြည့်ရှုနိုင်ပါသည်။
များပြားပြီး ရိုးရှင်းသော မျဉ်းဖြောင့်ဆုတ်ယုတ်မှု
နောက်ဆုံးတွင်၊ ၎င်းတို့သည် စာရင်းဇယားများတွင် အသုံးများသော regression model နှစ်ခုဖြစ်သောကြောင့် ရိုးရှင်းသော linear regression model နှင့် multiple linear regression model အကြား ခြားနားချက်များကို ကျွန်ုပ်တို့ မြင်တွေ့ရမည်ဖြစ်သည်။
Simple linear regression သည် အမှီအခိုကင်းသော variable ကိုဆက်စပ်ရန်အသုံးပြုသော regression model တစ်ခုဖြစ်သည်။ ထို့ကြောင့် ရိုးရိုး linear regression model ၏ ညီမျှခြင်းမှာ အောက်ပါအတိုင်းဖြစ်သည် ။
ထို့ကြောင့်၊ Multiple linear regression နှင့် simple linear regression အကြား ခြားနားချက်မှာ explanatory variables အရေအတွက်တွင် တည်ရှိသည်။ Multiple linear regression model တွင် explanatory variable နှစ်ခု သို့မဟုတ် ထို့ထက်ပို၍ ရှိပြီး၊ ရိုးရိုး linear regression model တွင် explanatory variable တစ်ခုသာရှိသည်။
နိဂုံးချုပ်အနေနှင့်၊ multiple linear regression သည် ရိုးရှင်းသော linear regression ၏ နောက်ဆက်တွဲတစ်ခုဖြစ်ပြီး၊ ပိုမိုရှင်းပြထားသော variable များနှင့် ၎င်းတို့၏ သက်ဆိုင်ရာ regression coefficients များကို ရိုးရှင်းစွာထည့်သွင်းထားသောကြောင့်ဖြစ်သည်။ သို့သော်၊ ဆုတ်ယုတ်မှုကိန်းဂဏန်းများကို ကွဲပြားစွာ တွက်ချက်ထားသည်၊ ၎င်းကို မည်သို့လုပ်ဆောင်သည်ကို ကြည့်ရှုရန် ဤနေရာကို နှိပ်ပါ-