အဖြစ်များသော ဆုတ်ယုတ်မှု အမျိုးအစား (၇) မျိုး (၎င်းတို့ကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်)


Regression analysis သည် စာရင်းဇယားများတွင် အသုံးအများဆုံး နည်းပညာများထဲမှ တစ်ခုဖြစ်သည်။

ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှု၏ အခြေခံပန်းတိုင်သည် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင် ကြားရှိ ဆက်နွယ်မှုကို အကောင်းဆုံးဖော်ပြသည့် မော်ဒယ်တစ်ခုနှင့် အံကိုက်ရန်ဖြစ်သည်။

ဤဆောင်းပါးတွင်၊ ကျွန်ုပ်တို့သည် လက်တွေ့ဘဝတွင် အသုံးအများဆုံး ဆုတ်ယုတ်မှုပုံစံ 7 ခုကို ဆုတ်ယုတ်မှုအမျိုးအစားတစ်ခုစီကို အသုံးပြုရမည့်အချိန်နှင့်အတူ မျှဝေပါသည်။

1. Linear ဆုတ်ယုတ်မှု

Linear regression ကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ခန့်မှန်းပေးသူ ကိန်းရှင်များနှင့် ကိန်းဂဏာန်း တုံ့ပြန်မှု ကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသော ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် အသုံးပြုသည်။

ဘယ်အချိန်မှာသုံးပါ

  • ကြိုတင်ခန့်မှန်းကိန်းရှင်(များ) နှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား ဆက်နွယ်မှုသည် ကျိုးကြောင်းဆီလျော်စွာ မျဉ်းဖြောင့်ဖြစ်သည်။
  • တုံ့ပြန်မှုကိန်းရှင်သည် စဉ်ဆက်မပြတ် ကိန်းဂဏာန်းတစ်ခုဖြစ်သည်။

ဥပမာ- လက်လီကုမ္ပဏီတစ်ခုသည် စုစုပေါင်းရောင်းအားကို ခန့်မှန်းရန် ကြော်ငြာအသုံးစရိတ်ကို အသုံးပြု၍ မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်နိုင်သည်။

ဤကိန်းရှင်နှစ်ခုကြားရှိ ဆက်နွယ်မှုသည် အညီအညွတ်ဖြစ်နိုင်သည် (ကြော်ငြာခအတွက် ယေဘုယျအားဖြင့် ငွေပို၍ရောင်းအားကို ဖြစ်ပေါ်စေသည်) နှင့် တုံ့ပြန်မှုကိန်းရှင် (စုစုပေါင်းရောင်းအား) သည် စဉ်ဆက်မပြတ်ကိန်းဂဏာန်းကိန်းရှင်ဖြစ်သောကြောင့်၊ မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို ချိန်ညှိရန် သင့်လျော်ပါသည်။

အရင်းအမြစ်- Multiple Linear Regression နိဒါန်း

2. Logistic ဆုတ်ယုတ်မှု

ကုန်စည်ပို့ဆောင်မှု ဆုတ်ယုတ်မှုအား ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုပြီး တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် ဒွိတုံ့ပြန်မှုကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုသည်။

ဘယ်အချိန်မှာသုံးပါ

  • တုံ့ပြန်မှုကိန်းရှင်သည် ဒွိနရီဖြစ်သည်- ၎င်းသည် တန်ဖိုးနှစ်ခုသာ ယူနိုင်သည်။

ဥပမာ- ဆေးသုတေသီများသည် နှလုံးဖောက်ခြင်းဖြစ်နိုင်ချေကို ခန့်မှန်းရန် လေ့ကျင့်ခန်းနှင့် ဆေးလိပ်သောက်ခြင်းအလေ့အထကို အသုံးပြု၍ ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်နိုင်သည်။

တုံ့ပြန်မှုပြောင်းလဲနိုင်သော (နှလုံးဖောက်ပြန်မှု) သည် ဒွိစုံဖြစ်သောကြောင့် – တစ်ဦးချင်းစီသည် နှလုံးဖောက်သည်ဖြစ်စေ မခံစားရသည်ဖြစ်စေ – ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် သင့်လျော်ပါသည်။

အရင်းအမြစ်- Logistic Regression နိဒါန်း

3. Polynomial ဆုတ်ယုတ်မှု

Polynomial regression ကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် ကိန်းဂဏာန်းဆိုင်ရာ တုံ့ပြန်မှုကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် အသုံးပြုသည်။

ဘယ်အချိန်မှာသုံးပါ

  • ကြိုတင်ခန့်မှန်းကိန်းရှင်(များ) နှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား ဆက်ဆံရေးသည် လိုင်းမဟုတ်ပေ။
  • တုံ့ပြန်မှုကိန်းရှင်သည် စဉ်ဆက်မပြတ် ကိန်းဂဏာန်းတစ်ခုဖြစ်သည်။

ဥပမာ- စိတ်ပညာရှင် များသည် လုပ်ငန်းနယ်ပယ်တစ်ခုရှိ ဝန်ထမ်းများ၏ “ အလုံးစုံပျော်ရွှင်မှု” ကို ခန့်မှန်းရန် “ နာရီများ အလုပ်လုပ်သည်” ကို အသုံးပြု၍ များစွာသော ဆုတ်ယုတ်မှုကို အံဝင်ခွင်ကျဖြစ်စေနိုင်သည်။

ဤကိန်းရှင်နှစ်ခုကြားရှိ ဆက်နွယ်မှုသည် မျဉ်းမဟုတ်ဟု ယူဆပါသည်။ ဆိုလိုသည်မှာ နာရီအရေအတွက်များလာသည်နှင့်အမျှ လူတစ်ဦးတစ်ယောက်သည် ပိုကြီးသောပျော်ရွှင်မှုကို သတင်းပို့နိုင်သော်လည်း အချို့သောအလုပ်ချိန်ထက်ကျော်လွန်ပါက အလုံးစုံပျော်ရွှင်မှုသည် လျော့နည်းသွားဖွယ်ရှိသည်။ ကြိုတင်ခန့်မှန်းကိန်းရှင်နှင့် တုံ့ပြန်မှုကိန်းရှင်ကြားတွင် ဤဆက်နွယ်မှုသည် လိုင်းမဆန်သောကြောင့်၊ ပေါလီအမည်ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် သင့်လျော်သည်။

အရင်းအမြစ်- Polynomial Regression နိဒါန်း

4. Ridge Regression

Ridge regression ကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် ကိန်းဂဏာန်းတုံ့ပြန်မှုကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီရန် အသုံးပြုသည်။

ဘယ်အချိန်မှာသုံးပါ

  • ကြိုတင်ခန့်မှန်းကိန်းရှင်များသည် အလွန်ဆက်စပ်နေပြီး ကော်လိုင်းအာနိသင်သည် ပြဿနာဖြစ်လာသည်။
  • တုံ့ပြန်မှုကိန်းရှင်သည် စဉ်ဆက်မပြတ် ကိန်းဂဏာန်းတစ်ခုဖြစ်သည်။

ဥပမာ- ဘတ်စကက်ဘောဒေတာ သိပ္ပံပညာရှင်တစ်ဦးသည် ကစားသမားလစာကို ခန့်မှန်းရန် အမှတ်၊ ပံ့ပိုးမှုနှင့် ပြန်လှန်မှုများကဲ့သို့သော ကြိုတင်ခန့်မှန်းကိန်းရှင်များကို အသုံးပြု၍ အခေါင်ဆုတ်ယုတ်မှုပုံစံကို အံဝင်ခွင်ကျဖြစ်စေနိုင်သည်။

ပိုကောင်းသောကစားသမားများသည် အမှတ်ပိုရခြင်း၊ ကူညီပေးခြင်းနှင့် ပြန်ပြန်ထွက်ခြင်းများရှိတတ်သောကြောင့် ကြိုတင်ခန့်မှန်းသည့်ကိန်းရှင်များသည် အလွန်ဆက်စပ်နိုင်ဖွယ်ရှိသည်။ ထို့ကြောင့်၊ multicollinearity သည် ပြဿနာတစ်ခုဖြစ်နိုင်သည်၊ ထို့ကြောင့် ridge regression ကိုသုံးခြင်းဖြင့် ဤပြဿနာကို လျှော့ချနိုင်သည်။

အရင်းအမြစ်- Ridge Regression နိဒါန်း

5. Lasso ဆုတ်ယုတ်မှု

Lasso regression သည် Ridge regression နှင့် အလွန်ဆင်တူပြီး တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် ကိန်းဂဏာန်းတုံ့ပြန်မှုကိန်းရှင်တို့ကြား ဆက်နွယ်မှုကို ဖော်ပြသော ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုပါသည်။

ဘယ်အချိန်မှာသုံးပါ

  • ကြိုတင်ခန့်မှန်းကိန်းရှင်များသည် အလွန်ဆက်စပ်နေပြီး ကော်လိုင်းအာနိသင်သည် ပြဿနာဖြစ်လာသည်။
  • တုံ့ပြန်မှုကိန်းရှင်သည် စဉ်ဆက်မပြတ် ကိန်းဂဏာန်းတစ်ခုဖြစ်သည်။

ဥပမာ- ဘောဂဗေဒပညာရှင်တစ်ဦးသည် အိမ်ထောင်စုဝင်ငွေကို ခန့်မှန်းရန် ကျောင်းပညာရေးစုစုပေါင်းနှစ်များ၊ အလုပ်ချိန်နှင့် နေထိုင်မှုစရိတ်စကများကို ခန့်မှန်းပေးသည့် ကိန်းရှင်များကို အသုံးပြု၍ lasso ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်ဖြစ်နိုင်သည်။

ပိုမိုပညာတတ်ပုဂ္ဂိုလ်များသည် နေထိုင်မှုစရိတ်ကြီးမြင့်ပြီး အလုပ်ချိန်ပိုရသောမြို့များတွင် နေထိုင်လေ့ရှိသောကြောင့် ကြိုတင်ခန့်မှန်းကိန်းရှင်များသည် အလွန်ဆက်စပ်နိုင်ဖွယ်ရှိသည်။ ထို့ကြောင့်၊ multicollinearity သည် ပြဿနာတစ်ခုဖြစ်နိုင်သည်၊ ထို့ကြောင့် lasso regression ကိုအသုံးပြုခြင်းဖြင့် ဤပြဿနာကို လျှော့ချနိုင်သည်။

Lasso regression နှင့် Ridge regression သည် အတော်လေး ဆင်တူကြောင်း သတိပြုပါ။ Multicollinearity သည် data set တစ်ခုတွင် ပြဿနာတစ်ခုဖြစ်သောအခါ၊ Lasso နှင့် Ridge regression model နှစ်ခုစလုံးနှင့် အံဝင်ခွင်ကျဖြစ်ရန် အကြံပြုထားသည်။

အရင်းအမြစ်- Lasso Regression နိဒါန်း

6. Poisson ဆုတ်ယုတ်မှု

Poisson ဆုတ်ယုတ်မှုအား တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်အကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုသည်။

ဘယ်အချိန်မှာသုံးပါ

  • တုံ့ပြန်မှုကိန်းရှင်သည် “ ရေတွက်ခြင်း” ဒေတာဖြစ်သည် – ဥပမာအားဖြင့် တစ်ပတ်လျှင် နေသာသောရက်အရေအတွက်၊ တစ်နှစ်လျှင် ယာဉ်မတော်တဆမှုအရေအတွက်၊ တစ်နေ့လျှင် ဖုန်းခေါ်ဆိုမှု အရေအတွက် စသည်ဖြင့်။

ဥပမာ- တက္ကသိုလ်တစ်ခုသည် ပရိုဂရမ်နှင့် ၎င်းတို့၏ GPA ပေါ်မူတည်၍ သီးခြားကောလိပ်ပရိုဂရမ်တစ်ခုမှ ဘွဲ့ရသော ကျောင်းသားအရေအတွက်ကို စစ်ဆေးရန် Poisson ဆုတ်ယုတ်မှုကို အသုံးပြုနိုင်သည်။

ဤကိစ္စတွင်၊ တုံ့ပြန်မှုကိန်းရှင်သည် ဒေတာရေတွက်ခြင်းဖြစ်သည် (ကျွန်ုပ်တို့သည် 200၊ 250၊ 300၊ 413 စသည်ဖြင့်) ဖြစ်သောကြောင့် Poisson regression ကိုအသုံးပြုရန် သင့်လျော်ပါသည်။

အရင်းအမြစ်- Poisson Regression နိဒါန်း

7. Quantile ဆုတ်ယုတ်မှု

Quantile regression ကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား ဆက်နွယ်မှုကို ဖော်ပြသည့် ဆုတ်ယုတ်မှုပုံစံတစ်ခုနှင့် ကိုက်ညီရန် အသုံးပြုသည်။

ဘယ်အချိန်မှာသုံးပါ

  • ကျွန်ုပ်တို့သည် တုံ့ပြန်မှု variable ၏ တိကျသောပမာဏ သို့မဟုတ် ရာခိုင်နှုန်းတစ်ခုကို ခန့်မှန်းလိုသည် – ဥပမာ 90th percentile၊ 95th percentile စသည်ဖြင့်။

ဥပမာ- လေ့လာခဲ့သည့် နာရီအရေအတွက်အပေါ် အခြေခံ၍ မျှော်မှန်းထားသည့် စာမေးပွဲရမှတ်များ၏ 90th ရာခိုင်နှုန်းကို ခန့်မှန်းရန် ပရော်ဖက်ဆာတစ်ဦးသည် အရေအတွက်အားဖြင့် ဆုတ်ယုတ်မှုကို အသုံးပြုနိုင်သည်။

ဤကိစ္စတွင်၊ ပါမောက္ခသည် တုံ့ပြန်မှုကိန်းရှင်၏ တိကျသောရာခိုင်နှုန်းတစ်ခုအား ခန့်မှန်းလိုသောကြောင့် (စာမေးပွဲရမှတ်များ)၊ quantile regression ကိုအသုံးပြုရန် သင့်လျော်ပါသည်။

အရင်းအမြစ်- Quantile Regression နိဒါန်း

ထပ်လောင်းအရင်းအမြစ်များ

လက်တွေ့ဘဝတွင် Linear Regression ကိုအသုံးပြုခြင်း ဥပမာ ၄
4 လက်တွေ့ဘဝတွင် Logistic Regression ကိုအသုံးပြုခြင်း၏နမူနာများ
ANOVA နှင့် ဆုတ်ယုတ်မှု- ကွာခြားချက်ကား အဘယ်နည်း။
လမ်းညွှန်ချက်အပြည့်အစုံ- ဆုတ်ယုတ်မှုရလဒ်များကို မည်သို့အစီရင်ခံမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်