Logistic regression vs linear regression- အဓိကကွာခြားချက်များ
အသုံးအများဆုံး ဆုတ်ယုတ်မှုပုံစံ နှစ်ခုမှာ linear regression နှင့် logistic regression ဖြစ်သည်။
ဆုတ်ယုတ်မှုပုံစံနှစ်မျိုးစလုံးကို ခန့်မှန်းတွက်ချက်နိုင်သောကိန်းရှင်တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင် ကြားရှိ ဆက်နွယ်မှုကို အရေအတွက်သတ်မှတ်ရန်အတွက် အသုံးပြုသော်လည်း မော်ဒယ်နှစ်ခုကြားတွင် အဓိကကွာခြားချက်အနည်းငယ်ရှိပါသည်-

ဤသည်မှာ ကွဲပြားမှုများ၏ အကျဉ်းချုပ်ဖြစ်သည်။
ကွာခြားချက် #1- တုံ့ပြန်မှု Variable အမျိုးအစား
တုံ့ပြန်မှုကိန်းရှင်သည် ထိုကဲ့သို့သော စဉ်ဆက်မပြတ်တန်ဖိုးကို ယူသောအခါ မျဉ်းကြောင်းပြန်ဆုတ်မှုပုံစံကို အသုံးပြုသည်-
- စျေးနှုန်း
- အရပ်အမြင့်
- အသက်
- အကွာအဝေး
အပြန်အလှန်အားဖြင့်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အောက်ပါကဲ့သို့သော အမျိုးအစားအလိုက်တန်ဖိုးကို ယူသောအခါ ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို အသုံးပြုသည်။
- ဟုတ်လားသို့မဟုတ်မဟုတ်ဘူးလား
- ကျားသို့မဟုတ်မ
- အောင်နိုင်သည်ဖြစ်စေ မနိုင်
ကွာခြားချက် # 2- ညီမျှခြင်းကို အသုံးပြုသည်။
Linear regression သည် ကြိုတင်ခန့်မှန်းကိန်းရှင် (များ) နှင့် တုံ့ပြန်မှု variable အကြား ဆက်နွယ်မှုကို အကျဉ်းချုပ်ရန် အောက်ပါညီမျှခြင်းကို အသုံးပြုသည်-
Y = β 0 + β 1 X 1 + β 2 X 2 + … + β p
ရွှေ-
- Y- တုံ့ပြန်မှု ကိန်းရှင်
- X j : j th ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်
- β j : X j တွင် တစ်ယူနစ်တိုးလာမှု၏ Y ပေါ်ရှိ ပျမ်းမျှအကျိုးသက်ရောက်မှုသည် အခြားကြိုတင်ခန့်မှန်းသူအားလုံးကို ပုံသေသတ်မှတ်ထားသည်
အပြန်အလှန်အားဖြင့်၊ logistic regression သည် အောက်ပါညီမျှခြင်းကို အသုံးပြုသည်-
p(X) = e β 0 + β 1 X 1 + β 2 X 2 + … + β p
ဤညီမျှခြင်းအား လူတစ်ဦးချင်းစီ၏ စူးစမ်းလေ့လာမှုသည် အမျိုးအစားတစ်ခုသို့ ကျရောက်နိုင်ခြေကို ခန့်မှန်းရန် အသုံးပြုသည်။
ကွာခြားချက် # 3- ညီမျှခြင်းနှင့်ကိုက်ညီရန် အသုံးပြုသည့်နည်းလမ်း
Linear regression သည် အသင့်တော်ဆုံး regression equation ကိုရှာဖွေရန် သာမန်အနည်းဆုံးစတုရန်းများ ဟုခေါ်သော နည်းလမ်းကိုအသုံးပြုသည်။
အပြန်အလှန်အားဖြင့်၊ logistic regression သည် အသင့်တော်ဆုံး regression equation ကိုရှာရန် အမြင့်ဆုံးဖြစ်နိုင်ခြေ ခန့်မှန်းချက် ဟုခေါ်သော နည်းလမ်းကို အသုံးပြုသည်။
ကွာခြားချက် # 4- ခန့်မှန်းရမည့်ရလဒ်
Linear regression သည် output အဖြစ် ဆက်တိုက်တန်ဖိုးကို ခန့်မှန်းသည်။ ဥပမာအားဖြင့်:
- ဈေးနှုန်း ($150၊ $199၊ $400 စသည်ဖြင့်)
- အရပ်အမြင့် (၁၄ လက်မ၊ ၂ ပေ၊ ၉၄.၃၂ စင်တီမီတာ၊ စသည်ဖြင့်)
- အသက် (၂ လ၊ ၆ နှစ်၊ ၄၁.၅ နှစ် စသဖြင့်)
- အကွာအဝေး (1.23 မိုင်၊ 4.5 ကီလိုမီတာ စသဖြင့်)
အပြန်အလှန်အားဖြင့်၊ ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုသည် ဖြစ်နိုင်ခြေများကို ရလဒ်တစ်ခုအဖြစ် ကြိုတင်ခန့်မှန်းသည်။ ဥပမာအားဖြင့်:
- တက္ကသိုလ်ဝင်ခွင့် ၄၀.၃ ရာခိုင်နှုန်း။
- ဂိမ်းတစ်ခုအနိုင်ရရန် 93.2% အခွင့်အလမ်း။
- ဥပဒေကို အတည်ပြုနိုင်ခြေ ၃၄.၂ ရာခိုင်နှုန်း။
ထောက်ပံ့ပို့ဆောင်ရေး သို့မဟုတ် မျဉ်းကြောင်းဆုတ်ယုတ်မှုကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်နည်း။
အောက်ဖော်ပြပါ အလေ့အကျင့်ဆိုင်ရာ ပြဿနာများသည် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှု သို့မဟုတ် မျဉ်းကြောင်းဆုတ်ယုတ်မှုကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်ကို ပိုမိုကောင်းမွန်စွာ နားလည်ရန် ကူညီပေးနိုင်ပါသည်။
ပြဿနာ #1- နှစ်စဉ် ၀င်ငွေ
ဘောဂဗေဒပညာရှင်တစ်ဦးသည် လူတစ်ဦးချင်းစီ၏ တစ်နှစ်ဝင်ငွေကို ခန့်မှန်းရန် အပတ်စဉ် (၁) နာရီ အလုပ်လုပ်ပြီး (၂) နှစ်ကြာ ပညာသင်ကြားလိုသည်ဆိုပါစို့။
ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုမပြောင်းလဲနိုင်သော (နှစ်စဉ်ဝင်ငွေ) သည် ဆက်တိုက်ဖြစ်နေသောကြောင့်၊ သူသည် linear regression ကို အသုံးပြုသည်။
ပြဿနာ # 2- ကောလိပ်လက်ခံခြင်း။
ကောလိပ်ဝင်ခွင့်အရာရှိတစ်ဦးသည် အချို့သောတက္ကသိုလ်တစ်ခုသို့ ကျောင်းသားတစ်ဦးအား လက်ခံခံရနိုင်ခြေကို ခန့်မှန်းရန် ခန့်မှန်းကိန်းရှင်များ (1) GPA နှင့် (2) ACT ရမှတ်များကို အသုံးပြုလိုသည်ဆိုပါစို့။
ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အမျိုးအစားခွဲခြားပြီး တန်ဖိုးနှစ်ခုသာယူနိုင်သောကြောင့် ထောက်ပံ့ ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို သူမက အသုံးပြုမည်ဖြစ်သည်။
ပြဿနာ # 3: အိမ်ခြံမြေစျေးနှုန်း
အိမ်ခြံမြေအကျိုးဆောင်တစ်ဦးသည် အိမ်အရောင်းစျေးနှုန်းများကို ခန့်မှန်းရန် (၁) စတုရန်းပေ၊ (၂) အိပ်ခန်းအရေအတွက်နှင့် ရေချိုးခန်းနံပါတ် (၃) တို့ကို ခန့်မှန်းသည့်ကိန်းရှင်များကို အသုံးပြုလိုသည်ဆိုပါစို့။
ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုမပြောင်းလဲနိုင်သော (စျေးနှုန်း) သည် ဆက်တိုက်ဖြစ်နေသောကြောင့် သူမသည် linear regression ကို အသုံးပြုမည်ဖြစ်သည်။
ပြဿနာ # 4- စပမ်းရှာဖွေခြင်း
ကွန်ပြူတာပရိုဂရမ်မာတစ်ဦးသည် ပေးထားသောအီးမေးလ်သည် spam ဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် ခန့်မှန်းကိန်းရှင်များ (1) စကားလုံးရေတွက်ခြင်းနှင့် (2) မူရင်းနိုင်ငံကို အသုံးပြုလိုသည်ဆိုပါစို့။
ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အမျိုးအစားခွဲခြားပြီး တန်ဖိုးနှစ်ခုသာယူနိုင်သည်- စပမ်း သို့မဟုတ် စပမ်းမဟုတ်သောကြောင့် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို အသုံးပြုမည်ဖြစ်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် linear regression ဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ပေးဆောင်သည်-
- Simple Linear Regression နိဒါန်း
- Multiple Linear Regression အကြောင်း နိဒါန်း
- လက်တွေ့ဘဝတွင် Linear Regression ကိုအသုံးပြုခြင်း ဥပမာ 4
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ထောက်လှမ်းဆုတ်ယုတ်မှုဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ပေးဆောင်သည်-