အဖြစ်များသော ဆုတ်ယုတ်မှု အမျိုးအစား (၇) မျိုး (၎င်းတို့ကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်)
Regression analysis သည် စာရင်းဇယားများတွင် အသုံးအများဆုံး နည်းပညာများထဲမှ တစ်ခုဖြစ်သည်။
ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှု၏ အခြေခံပန်းတိုင်သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင် ကြားရှိ ဆက်နွယ်မှုကို အကောင်းဆုံးဖော်ပြသည့် မော်ဒယ်တစ်ခုနှင့် အံကိုက်ရန်ဖြစ်သည်။
ဤဆောင်းပါးတွင်၊ ကျွန်ုပ်တို့သည် လက်တွေ့ဘဝတွင် အသုံးအများဆုံး ဆုတ်ယုတ်မှုပုံစံ 7 ခုကို ဆုတ်ယုတ်မှုအမျိုးအစားတစ်ခုစီကို အသုံးပြုရမည့်အချိန်နှင့်အတူ မျှဝေပါသည်။
1. Linear ဆုတ်ယုတ်မှု
Linear regression ကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ခန့်မှန်းပေးသူ ကိန်းရှင်များနှင့် ကိန်းဂဏာန်း တုံ့ပြန်မှု ကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသော ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် အသုံးပြုသည်။
ဘယ်အချိန်မှာသုံးပါ
- ကြိုတင်ခန့်မှန်းကိန်းရှင်(များ) နှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား ဆက်နွယ်မှုသည် ကျိုးကြောင်းဆီလျော်စွာ မျဉ်းဖြောင့်ဖြစ်သည်။
- တုံ့ပြန်မှုကိန်းရှင်သည် စဉ်ဆက်မပြတ် ကိန်းဂဏာန်းတစ်ခုဖြစ်သည်။
ဥပမာ- လက်လီကုမ္ပဏီတစ်ခုသည် စုစုပေါင်းရောင်းအားကို ခန့်မှန်းရန် ကြော်ငြာအသုံးစရိတ်ကို အသုံးပြု၍ မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်နိုင်သည်။
ဤကိန်းရှင်နှစ်ခုကြားရှိ ဆက်နွယ်မှုသည် အညီအညွတ်ဖြစ်နိုင်သည် (ကြော်ငြာခအတွက် ယေဘုယျအားဖြင့် ငွေပို၍ရောင်းအားကို ဖြစ်ပေါ်စေသည်) နှင့် တုံ့ပြန်မှုကိန်းရှင် (စုစုပေါင်းရောင်းအား) သည် စဉ်ဆက်မပြတ်ကိန်းဂဏာန်းကိန်းရှင်ဖြစ်သောကြောင့်၊ မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို ချိန်ညှိရန် သင့်လျော်ပါသည်။
အရင်းအမြစ်- Multiple Linear Regression နိဒါန်း
2. Logistic ဆုတ်ယုတ်မှု
ကုန်စည်ပို့ဆောင်မှု ဆုတ်ယုတ်မှုအား ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုပြီး တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် ဒွိတုံ့ပြန်မှုကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုသည်။
ဘယ်အချိန်မှာသုံးပါ
- တုံ့ပြန်မှုကိန်းရှင်သည် ဒွိနရီဖြစ်သည်- ၎င်းသည် တန်ဖိုးနှစ်ခုသာ ယူနိုင်သည်။
ဥပမာ- ဆေးသုတေသီများသည် နှလုံးဖောက်ခြင်းဖြစ်နိုင်ချေကို ခန့်မှန်းရန် လေ့ကျင့်ခန်းနှင့် ဆေးလိပ်သောက်ခြင်းအလေ့အထကို အသုံးပြု၍ ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်နိုင်သည်။
တုံ့ပြန်မှုပြောင်းလဲနိုင်သော (နှလုံးဖောက်ပြန်မှု) သည် ဒွိစုံဖြစ်သောကြောင့် – တစ်ဦးချင်းစီသည် နှလုံးဖောက်သည်ဖြစ်စေ မခံစားရသည်ဖြစ်စေ – ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် သင့်လျော်ပါသည်။
အရင်းအမြစ်- Logistic Regression နိဒါန်း
3. Polynomial ဆုတ်ယုတ်မှု
Polynomial regression ကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် ကိန်းဂဏာန်းဆိုင်ရာ တုံ့ပြန်မှုကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် အသုံးပြုသည်။
ဘယ်အချိန်မှာသုံးပါ
- ကြိုတင်ခန့်မှန်းကိန်းရှင်(များ) နှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား ဆက်ဆံရေးသည် လိုင်းမဟုတ်ပေ။
- တုံ့ပြန်မှုကိန်းရှင်သည် စဉ်ဆက်မပြတ် ကိန်းဂဏာန်းတစ်ခုဖြစ်သည်။
ဥပမာ- စိတ်ပညာရှင် များသည် လုပ်ငန်းနယ်ပယ်တစ်ခုရှိ ဝန်ထမ်းများ၏ “ အလုံးစုံပျော်ရွှင်မှု” ကို ခန့်မှန်းရန် “ နာရီများ အလုပ်လုပ်သည်” ကို အသုံးပြု၍ များစွာသော ဆုတ်ယုတ်မှုကို အံဝင်ခွင်ကျဖြစ်စေနိုင်သည်။
ဤကိန်းရှင်နှစ်ခုကြားရှိ ဆက်နွယ်မှုသည် မျဉ်းမဟုတ်ဟု ယူဆပါသည်။ ဆိုလိုသည်မှာ နာရီအရေအတွက်များလာသည်နှင့်အမျှ လူတစ်ဦးတစ်ယောက်သည် ပိုကြီးသောပျော်ရွှင်မှုကို သတင်းပို့နိုင်သော်လည်း အချို့သောအလုပ်ချိန်ထက်ကျော်လွန်ပါက အလုံးစုံပျော်ရွှင်မှုသည် လျော့နည်းသွားဖွယ်ရှိသည်။ ကြိုတင်ခန့်မှန်းကိန်းရှင်နှင့် တုံ့ပြန်မှုကိန်းရှင်ကြားတွင် ဤဆက်နွယ်မှုသည် လိုင်းမဆန်သောကြောင့်၊ ပေါလီအမည်ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် သင့်လျော်သည်။
အရင်းအမြစ်- Polynomial Regression နိဒါန်း
4. Ridge Regression
Ridge regression ကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် ကိန်းဂဏာန်းတုံ့ပြန်မှုကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် အသုံးပြုသည်။
ဘယ်အချိန်မှာသုံးပါ
- ကြိုတင်ခန့်မှန်းကိန်းရှင်များသည် အလွန်ဆက်စပ်နေပြီး ကော်လိုင်းအာနိသင်သည် ပြဿနာဖြစ်လာသည်။
- တုံ့ပြန်မှုကိန်းရှင်သည် စဉ်ဆက်မပြတ် ကိန်းဂဏာန်းတစ်ခုဖြစ်သည်။
ဥပမာ- ဘတ်စကက်ဘောဒေတာ သိပ္ပံပညာရှင်တစ်ဦးသည် ကစားသမားလစာကို ခန့်မှန်းရန် အမှတ်၊ ပံ့ပိုးမှုနှင့် ပြန်လှန်မှုများကဲ့သို့သော ကြိုတင်ခန့်မှန်းကိန်းရှင်များကို အသုံးပြု၍ အခေါင်ဆုတ်ယုတ်မှုပုံစံကို အံဝင်ခွင်ကျဖြစ်စေနိုင်သည်။
ပိုကောင်းသောကစားသမားများသည် အမှတ်ပိုရခြင်း၊ ကူညီပေးခြင်းနှင့် ပြန်ပြန်ထွက်ခြင်းများရှိတတ်သောကြောင့် ကြိုတင်ခန့်မှန်းသည့်ကိန်းရှင်များသည် အလွန်ဆက်စပ်နိုင်ဖွယ်ရှိသည်။ ထို့ကြောင့်၊ multicollinearity သည် ပြဿနာတစ်ခုဖြစ်နိုင်သည်၊ ထို့ကြောင့် ridge regression ကိုသုံးခြင်းဖြင့် ဤပြဿနာကို လျှော့ချနိုင်သည်။
အရင်းအမြစ်- Ridge Regression နိဒါန်း
5. Lasso ဆုတ်ယုတ်မှု
Lasso regression သည် Ridge regression နှင့် အလွန်ဆင်တူပြီး တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် ကိန်းဂဏာန်းတုံ့ပြန်မှုကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသော ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုပါသည်။
ဘယ်အချိန်မှာသုံးပါ
- ကြိုတင်ခန့်မှန်းကိန်းရှင်များသည် အလွန်ဆက်စပ်နေပြီး ကော်လိုင်းအာနိသင်သည် ပြဿနာဖြစ်လာသည်။
- တုံ့ပြန်မှုကိန်းရှင်သည် စဉ်ဆက်မပြတ် ကိန်းဂဏာန်းတစ်ခုဖြစ်သည်။
ဥပမာ- ဘောဂဗေဒပညာရှင်တစ်ဦးသည် အိမ်ထောင်စုဝင်ငွေကို ခန့်မှန်းရန် ကျောင်းပညာရေးစုစုပေါင်းနှစ်များ၊ အလုပ်ချိန်နှင့် နေထိုင်မှုစရိတ်စကများကို ခန့်မှန်းပေးသည့် ကိန်းရှင်များကို အသုံးပြု၍ lasso ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်ဖြစ်နိုင်သည်။
ပိုမိုပညာတတ်ပုဂ္ဂိုလ်များသည် နေထိုင်မှုစရိတ်ကြီးမြင့်ပြီး အလုပ်ချိန်ပိုရသောမြို့များတွင် နေထိုင်လေ့ရှိသောကြောင့် ကြိုတင်ခန့်မှန်းကိန်းရှင်များသည် အလွန်ဆက်စပ်နိုင်ဖွယ်ရှိသည်။ ထို့ကြောင့်၊ multicollinearity သည် ပြဿနာတစ်ခုဖြစ်နိုင်သည်၊ ထို့ကြောင့် lasso regression ကိုအသုံးပြုခြင်းဖြင့် ဤပြဿနာကို လျှော့ချနိုင်သည်။
Lasso regression နှင့် Ridge regression သည် အတော်လေး ဆင်တူကြောင်း သတိပြုပါ။ Multicollinearity သည် data set တစ်ခုတွင် ပြဿနာတစ်ခုဖြစ်သောအခါ၊ Lasso နှင့် Ridge regression model နှစ်ခုစလုံးနှင့် အံဝင်ခွင်ကျဖြစ်ရန် အကြံပြုထားသည်။
အရင်းအမြစ်- Lasso Regression နိဒါန်း
6. Poisson ဆုတ်ယုတ်မှု
Poisson ဆုတ်ယုတ်မှုအား တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်အကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုသည်။
ဘယ်အချိန်မှာသုံးပါ
- တုံ့ပြန်မှုကိန်းရှင်သည် “ ရေတွက်ခြင်း” ဒေတာဖြစ်သည် – ဥပမာအားဖြင့် တစ်ပတ်လျှင် နေသာသောရက်အရေအတွက်၊ တစ်နှစ်လျှင် ယာဉ်မတော်တဆမှုအရေအတွက်၊ တစ်နေ့လျှင် ဖုန်းခေါ်ဆိုမှု အရေအတွက် စသည်ဖြင့်။
ဥပမာ- တက္ကသိုလ်တစ်ခုသည် ပရိုဂရမ်နှင့် ၎င်းတို့၏ GPA ပေါ်မူတည်၍ သီးခြားကောလိပ်ပရိုဂရမ်တစ်ခုမှ ဘွဲ့ရသော ကျောင်းသားအရေအတွက်ကို စစ်ဆေးရန် Poisson ဆုတ်ယုတ်မှုကို အသုံးပြုနိုင်သည်။
ဤကိစ္စတွင်၊ တုံ့ပြန်မှုကိန်းရှင်သည် ဒေတာရေတွက်ခြင်းဖြစ်သည် (ကျွန်ုပ်တို့သည် 200၊ 250၊ 300၊ 413 စသည်ဖြင့်) ဖြစ်သောကြောင့် Poisson regression ကိုအသုံးပြုရန် သင့်လျော်ပါသည်။
အရင်းအမြစ်- Poisson Regression နိဒါန်း
7. Quantile ဆုတ်ယုတ်မှု
Quantile regression ကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုသည်။
ဘယ်အချိန်မှာသုံးပါ
- ကျွန်ုပ်တို့သည် တုံ့ပြန်မှု variable ၏ တိကျသောပမာဏ သို့မဟုတ် ရာခိုင်နှုန်းတစ်ခုကို ခန့်မှန်းလိုသည် – ဥပမာ 90th percentile၊ 95th percentile စသည်ဖြင့်။
ဥပမာ- လေ့လာခဲ့သည့် နာရီအရေအတွက်အပေါ် အခြေခံ၍ မျှော်မှန်းထားသည့် စာမေးပွဲရမှတ်များ၏ 90th ရာခိုင်နှုန်းကို ခန့်မှန်းရန် ပရော်ဖက်ဆာတစ်ဦးသည် အရေအတွက်အားဖြင့် ဆုတ်ယုတ်မှုကို အသုံးပြုနိုင်သည်။
ဤကိစ္စတွင်၊ ပါမောက္ခသည် တုံ့ပြန်မှုကိန်းရှင်၏ တိကျသောရာခိုင်နှုန်းတစ်ခုအား ခန့်မှန်းလိုသောကြောင့် (စာမေးပွဲရမှတ်များ)၊ quantile regression ကိုအသုံးပြုရန် သင့်လျော်ပါသည်။
အရင်းအမြစ်- Quantile Regression နိဒါန်း
ထပ်လောင်းအရင်းအမြစ်များ
လက်တွေ့ဘဝတွင် Linear Regression ကိုအသုံးပြုခြင်း ဥပမာ ၄
4 လက်တွေ့ဘဝတွင် Logistic Regression ကိုအသုံးပြုခြင်း၏နမူနာများ
ANOVA နှင့် ဆုတ်ယုတ်မှု- ကွာခြားချက်ကား အဘယ်နည်း။
လမ်းညွှန်ချက်အပြည့်အစုံ- ဆုတ်ယုတ်မှုရလဒ်များကို မည်သို့အစီရင်ခံမည်နည်း။