Logistic regression vs linear regression- အဓိကကွာခြားချက်များ


အသုံးအများဆုံး ဆုတ်ယုတ်မှုပုံစံ နှစ်ခုမှာ linear regression နှင့် logistic regression ဖြစ်သည်။

ဆုတ်ယုတ်မှုပုံစံနှစ်မျိုးစလုံးကို ခန့်မှန်းတွက်ချက်နိုင်သောကိန်းရှင်တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင် ကြားရှိ ဆက်နွယ်မှုကို အရေအတွက်သတ်မှတ်ရန်အတွက် အသုံးပြုသော်လည်း မော်ဒယ်နှစ်ခုကြားတွင် အဓိကကွာခြားချက်အနည်းငယ်ရှိပါသည်-

ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုနှင့် မျဉ်းကြောင်း ဆုတ်ယုတ်မှု

ဤသည်မှာ ကွဲပြားမှုများ၏ အကျဉ်းချုပ်ဖြစ်သည်။

ကွာခြားချက် #1- တုံ့ပြန်မှု Variable အမျိုးအစား

တုံ့ပြန်မှုကိန်းရှင်သည် ထိုကဲ့သို့သော စဉ်ဆက်မပြတ်တန်ဖိုးကို ယူသောအခါ မျဉ်းကြောင်းပြန်ဆုတ်မှုပုံစံကို အသုံးပြုသည်-

  • စျေးနှုန်း
  • အရပ်အမြင့်
  • အသက်
  • အကွာအဝေး

အပြန်အလှန်အားဖြင့်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အောက်ပါကဲ့သို့သော အမျိုးအစားအလိုက်တန်ဖိုးကို ယူသောအခါ ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို အသုံးပြုသည်။

  • ဟုတ်လားသို့မဟုတ်မဟုတ်ဘူးလား
  • ကျားသို့မဟုတ်မ
  • အောင်နိုင်သည်ဖြစ်စေ မနိုင်

ကွာခြားချက် # 2- ညီမျှခြင်းကို အသုံးပြုသည်။

Linear regression သည် ကြိုတင်ခန့်မှန်းကိန်းရှင် (များ) နှင့် တုံ့ပြန်မှု variable အကြား ဆက်နွယ်မှုကို အကျဉ်းချုပ်ရန် အောက်ပါညီမျှခြင်းကို အသုံးပြုသည်-

Y = β 0 + β 1 X 1 + β 2 X 2 + … + β p

ရွှေ-

  • Y- တုံ့ပြန်မှု ကိန်းရှင်
  • X j : j th ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်
  • β j : X j တွင် တစ်ယူနစ်တိုးလာမှု၏ Y ပေါ်ရှိ ပျမ်းမျှအကျိုးသက်ရောက်မှုသည် အခြားကြိုတင်ခန့်မှန်းသူအားလုံးကို ပုံသေသတ်မှတ်ထားသည်

အပြန်အလှန်အားဖြင့်၊ logistic regression သည် အောက်ပါညီမျှခြင်းကို အသုံးပြုသည်-

p(X) = e β 0 + β 1 X 1 + β 2 X 2 + + β p

ဤညီမျှခြင်းအား လူတစ်ဦးချင်းစီ၏ စူးစမ်းလေ့လာမှုသည် အမျိုးအစားတစ်ခုသို့ ကျရောက်နိုင်ခြေကို ခန့်မှန်းရန် အသုံးပြုသည်။

ကွာခြားချက် # 3- ညီမျှခြင်းနှင့်ကိုက်ညီရန် အသုံးပြုသည့်နည်းလမ်း

Linear regression သည် အသင့်တော်ဆုံး regression equation ကိုရှာဖွေရန် သာမန်အနည်းဆုံးစတုရန်းများ ဟုခေါ်သော နည်းလမ်းကိုအသုံးပြုသည်။

အပြန်အလှန်အားဖြင့်၊ logistic regression သည် အသင့်တော်ဆုံး regression equation ကိုရှာရန် အမြင့်ဆုံးဖြစ်နိုင်ခြေ ခန့်မှန်းချက် ဟုခေါ်သော နည်းလမ်းကို အသုံးပြုသည်။

ကွာခြားချက် # 4- ခန့်မှန်းရမည့်ရလဒ်

Linear regression သည် output အဖြစ် ဆက်တိုက်တန်ဖိုးကို ခန့်မှန်းသည်။ ဥပမာအားဖြင့်:

  • ဈေးနှုန်း ($150၊ $199၊ $400 စသည်ဖြင့်)
  • အရပ်အမြင့် (၁၄ လက်မ၊ ၂ ပေ၊ ၉၄.၃၂ စင်တီမီတာ၊ စသည်ဖြင့်)
  • အသက် (၂ လ၊ ၆ နှစ်၊ ၄၁.၅ နှစ် စသဖြင့်)
  • အကွာအဝေး (1.23 မိုင်၊ 4.5 ကီလိုမီတာ စသဖြင့်)

အပြန်အလှန်အားဖြင့်၊ ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုသည် ဖြစ်နိုင်ခြေများကို ရလဒ်တစ်ခုအဖြစ် ကြိုတင်ခန့်မှန်းသည်။ ဥပမာအားဖြင့်:

  • တက္ကသိုလ်ဝင်ခွင့် ၄၀.၃ ရာခိုင်နှုန်း။
  • ဂိမ်းတစ်ခုအနိုင်ရရန် 93.2% အခွင့်အလမ်း။
  • ဥပဒေကို အတည်ပြုနိုင်ခြေ ၃၄.၂ ရာခိုင်နှုန်း။

ထောက်ပံ့ပို့ဆောင်ရေး သို့မဟုတ် မျဉ်းကြောင်းဆုတ်ယုတ်မှုကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်နည်း။

အောက်ဖော်ပြပါ အလေ့အကျင့်ဆိုင်ရာ ပြဿနာများသည် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှု သို့မဟုတ် မျဉ်းကြောင်းဆုတ်ယုတ်မှုကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်ကို ပိုမိုကောင်းမွန်စွာ နားလည်ရန် ကူညီပေးနိုင်ပါသည်။

ပြဿနာ #1- နှစ်စဉ် ၀င်ငွေ

ဘောဂဗေဒပညာရှင်တစ်ဦးသည် လူတစ်ဦးချင်းစီ၏ တစ်နှစ်ဝင်ငွေကို ခန့်မှန်းရန် အပတ်စဉ် (၁) နာရီ အလုပ်လုပ်ပြီး (၂) နှစ်ကြာ ပညာသင်ကြားလိုသည်ဆိုပါစို့။

ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုမပြောင်းလဲနိုင်သော (နှစ်စဉ်ဝင်ငွေ) သည် ဆက်တိုက်ဖြစ်နေသောကြောင့်၊ သူသည် linear regression ကို အသုံးပြုသည်။

ပြဿနာ # 2- ကောလိပ်လက်ခံခြင်း။

ကောလိပ်ဝင်ခွင့်အရာရှိတစ်ဦးသည် အချို့သောတက္ကသိုလ်တစ်ခုသို့ ကျောင်းသားတစ်ဦးအား လက်ခံခံရနိုင်ခြေကို ခန့်မှန်းရန် ခန့်မှန်းကိန်းရှင်များ (1) GPA နှင့် (2) ACT ရမှတ်များကို အသုံးပြုလိုသည်ဆိုပါစို့။

ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အမျိုးအစားခွဲခြားပြီး တန်ဖိုးနှစ်ခုသာယူနိုင်သောကြောင့် ထောက်ပံ့ ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို သူမက အသုံးပြုမည်ဖြစ်သည်။

ပြဿနာ # 3: အိမ်ခြံမြေစျေးနှုန်း

အိမ်ခြံမြေအကျိုးဆောင်တစ်ဦးသည် အိမ်အရောင်းစျေးနှုန်းများကို ခန့်မှန်းရန် (၁) စတုရန်းပေ၊ (၂) အိပ်ခန်းအရေအတွက်နှင့် ရေချိုးခန်းနံပါတ် (၃) တို့ကို ခန့်မှန်းသည့်ကိန်းရှင်များကို အသုံးပြုလိုသည်ဆိုပါစို့။

ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုမပြောင်းလဲနိုင်သော (စျေးနှုန်း) သည် ဆက်တိုက်ဖြစ်နေသောကြောင့် သူမသည် linear regression ကို အသုံးပြုမည်ဖြစ်သည်။

ပြဿနာ # 4- စပမ်းရှာဖွေခြင်း

ကွန်ပြူတာပရိုဂရမ်မာတစ်ဦးသည် ပေးထားသောအီးမေးလ်သည် spam ဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် ခန့်မှန်းကိန်းရှင်များ (1) စကားလုံးရေတွက်ခြင်းနှင့် (2) မူရင်းနိုင်ငံကို အသုံးပြုလိုသည်ဆိုပါစို့။

ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အမျိုးအစားခွဲခြားပြီး တန်ဖိုးနှစ်ခုသာယူနိုင်သည်- စပမ်း သို့မဟုတ် စပမ်းမဟုတ်သောကြောင့် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို အသုံးပြုမည်ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် linear regression ဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ပေးဆောင်သည်-

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ထောက်လှမ်းဆုတ်ယုတ်မှုဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ပေးဆောင်သည်-

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်