Logistic regression vs linear regression- အဓိကကွာခြားချက်များ

အားဖြင့် Benjamin Anderson ဇူလိုင် 24, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

အသုံးအများဆုံး ဆုတ်ယုတ်မှုပုံစံ နှစ်ခုမှာ linear regression နှင့် logistic regression ဖြစ်သည်။

ဆုတ်ယုတ်မှုပုံစံနှစ်မျိုးစလုံးကို ခန့်မှန်းတွက်ချက်နိုင်သောကိန်းရှင်တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင် ကြားရှိ ဆက်နွယ်မှုကို အရေအတွက်သတ်မှတ်ရန်အတွက် အသုံးပြုသော်လည်း မော်ဒယ်နှစ်ခုကြားတွင် အဓိကကွာခြားချက်အနည်းငယ်ရှိပါသည်-

ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုနှင့် မျဉ်းကြောင်း ဆုတ်ယုတ်မှု

ဤသည်မှာ ကွဲပြားမှုများ၏ အကျဉ်းချုပ်ဖြစ်သည်။

ကွာခြားချက် #1- တုံ့ပြန်မှု Variable အမျိုးအစား

တုံ့ပြန်မှုကိန်းရှင်သည် ထိုကဲ့သို့သော စဉ်ဆက်မပြတ်တန်ဖိုးကို ယူသောအခါ မျဉ်းကြောင်းပြန်ဆုတ်မှုပုံစံကို အသုံးပြုသည်-

စျေးနှုန်း
အရပ်အမြင့်
အသက်
အကွာအဝေး

အပြန်အလှန်အားဖြင့်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အောက်ပါကဲ့သို့သော အမျိုးအစားအလိုက်တန်ဖိုးကို ယူသောအခါ ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို အသုံးပြုသည်။

ဟုတ်လားသို့မဟုတ်မဟုတ်ဘူးလား
ကျားသို့မဟုတ်မ
အောင်နိုင်သည်ဖြစ်စေ မနိုင်

ကွာခြားချက် # 2- ညီမျှခြင်းကို အသုံးပြုသည်။

Linear regression သည် ကြိုတင်ခန့်မှန်းကိန်းရှင် (များ) နှင့် တုံ့ပြန်မှု variable အကြား ဆက်နွယ်မှုကို အကျဉ်းချုပ်ရန် အောက်ပါညီမျှခြင်းကို အသုံးပြုသည်-

Y = β ₀ + β ₁ X ₁ ₊ β ₂ X ₂ + … + β _p

ရွှေ-

Y- တုံ့ပြန်မှု ကိန်းရှင်
X _j : j ^th ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်
β _j : X _j တွင် တစ်ယူနစ်တိုးလာမှု၏ Y ပေါ်ရှိ ပျမ်းမျှအကျိုးသက်ရောက်မှုသည် အခြားကြိုတင်ခန့်မှန်းသူအားလုံးကို ပုံသေသတ်မှတ်ထားသည်

အပြန်အလှန်အားဖြင့်၊ logistic regression သည် အောက်ပါညီမျှခြင်းကို အသုံးပြုသည်-

p(X) = e ^{β ₀ + _β ₁ _X ₁ ₊ _β} ^{₂ _X ₂ ₊ _… ₊ _β} p

ဤညီမျှခြင်းအား လူတစ်ဦးချင်းစီ၏ စူးစမ်းလေ့လာမှုသည် အမျိုးအစားတစ်ခုသို့ ကျရောက်နိုင်ခြေကို ခန့်မှန်းရန် အသုံးပြုသည်။

ကွာခြားချက် # 3- ညီမျှခြင်းနှင့်ကိုက်ညီရန် အသုံးပြုသည့်နည်းလမ်း

Linear regression သည် အသင့်တော်ဆုံး regression equation ကိုရှာဖွေရန် သာမန်အနည်းဆုံးစတုရန်းများ ဟုခေါ်သော နည်းလမ်းကိုအသုံးပြုသည်။

အပြန်အလှန်အားဖြင့်၊ logistic regression သည် အသင့်တော်ဆုံး regression equation ကိုရှာရန် အမြင့်ဆုံးဖြစ်နိုင်ခြေ ခန့်မှန်းချက် ဟုခေါ်သော နည်းလမ်းကို အသုံးပြုသည်။

ကွာခြားချက် # 4- ခန့်မှန်းရမည့်ရလဒ်

Linear regression သည် output အဖြစ် ဆက်တိုက်တန်ဖိုးကို ခန့်မှန်းသည်။ ဥပမာအားဖြင့်:

ဈေးနှုန်း ($150၊ $199၊ $400 စသည်ဖြင့်)
အရပ်အမြင့် (၁၄ လက်မ၊ ၂ ပေ၊ ၉၄.၃၂ စင်တီမီတာ၊ စသည်ဖြင့်)
အသက် (၂ လ၊ ၆ နှစ်၊ ၄၁.၅ နှစ် စသဖြင့်)
အကွာအဝေး (1.23 မိုင်၊ 4.5 ကီလိုမီတာ စသဖြင့်)

အပြန်အလှန်အားဖြင့်၊ ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုသည် ဖြစ်နိုင်ခြေများကို ရလဒ်တစ်ခုအဖြစ် ကြိုတင်ခန့်မှန်းသည်။ ဥပမာအားဖြင့်:

တက္ကသိုလ်ဝင်ခွင့် ၄၀.၃ ရာခိုင်နှုန်း။
ဂိမ်းတစ်ခုအနိုင်ရရန် 93.2% အခွင့်အလမ်း။
ဥပဒေကို အတည်ပြုနိုင်ခြေ ၃၄.၂ ရာခိုင်နှုန်း။

ထောက်ပံ့ပို့ဆောင်ရေး သို့မဟုတ် မျဉ်းကြောင်းဆုတ်ယုတ်မှုကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်နည်း။

အောက်ဖော်ပြပါ အလေ့အကျင့်ဆိုင်ရာ ပြဿနာများသည် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှု သို့မဟုတ် မျဉ်းကြောင်းဆုတ်ယုတ်မှုကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်ကို ပိုမိုကောင်းမွန်စွာ နားလည်ရန် ကူညီပေးနိုင်ပါသည်။

ပြဿနာ #1- နှစ်စဉ် ၀င်ငွေ

ဘောဂဗေဒပညာရှင်တစ်ဦးသည် လူတစ်ဦးချင်းစီ၏ တစ်နှစ်ဝင်ငွေကို ခန့်မှန်းရန် အပတ်စဉ် (၁) နာရီ အလုပ်လုပ်ပြီး (၂) နှစ်ကြာ ပညာသင်ကြားလိုသည်ဆိုပါစို့။

ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုမပြောင်းလဲနိုင်သော (နှစ်စဉ်ဝင်ငွေ) သည် ဆက်တိုက်ဖြစ်နေသောကြောင့်၊ သူသည် linear regression ကို အသုံးပြုသည်။

ပြဿနာ # 2- ကောလိပ်လက်ခံခြင်း။

ကောလိပ်ဝင်ခွင့်အရာရှိတစ်ဦးသည် အချို့သောတက္ကသိုလ်တစ်ခုသို့ ကျောင်းသားတစ်ဦးအား လက်ခံခံရနိုင်ခြေကို ခန့်မှန်းရန် ခန့်မှန်းကိန်းရှင်များ (1) GPA နှင့် (2) ACT ရမှတ်များကို အသုံးပြုလိုသည်ဆိုပါစို့။

ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အမျိုးအစားခွဲခြားပြီး တန်ဖိုးနှစ်ခုသာယူနိုင်သောကြောင့် ထောက်ပံ့ ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို သူမက အသုံးပြုမည်ဖြစ်သည်။

ပြဿနာ # 3: အိမ်ခြံမြေစျေးနှုန်း

အိမ်ခြံမြေအကျိုးဆောင်တစ်ဦးသည် အိမ်အရောင်းစျေးနှုန်းများကို ခန့်မှန်းရန် (၁) စတုရန်းပေ၊ (၂) အိပ်ခန်းအရေအတွက်နှင့် ရေချိုးခန်းနံပါတ် (၃) တို့ကို ခန့်မှန်းသည့်ကိန်းရှင်များကို အသုံးပြုလိုသည်ဆိုပါစို့။

ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုမပြောင်းလဲနိုင်သော (စျေးနှုန်း) သည် ဆက်တိုက်ဖြစ်နေသောကြောင့် သူမသည် linear regression ကို အသုံးပြုမည်ဖြစ်သည်။

ပြဿနာ # 4- စပမ်းရှာဖွေခြင်း

ကွန်ပြူတာပရိုဂရမ်မာတစ်ဦးသည် ပေးထားသောအီးမေးလ်သည် spam ဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် ခန့်မှန်းကိန်းရှင်များ (1) စကားလုံးရေတွက်ခြင်းနှင့် (2) မူရင်းနိုင်ငံကို အသုံးပြုလိုသည်ဆိုပါစို့။

ဤအခြေအနေတွင်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အမျိုးအစားခွဲခြားပြီး တန်ဖိုးနှစ်ခုသာယူနိုင်သည်- စပမ်း သို့မဟုတ် စပမ်းမဟုတ်သောကြောင့် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို အသုံးပြုမည်ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် linear regression ဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ပေးဆောင်သည်-

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ထောက်လှမ်းဆုတ်ယုတ်မှုဆိုင်ရာ အသေးစိတ်အချက်အလက်များကို ပေးဆောင်သည်-

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

ထောက်ပံ့ပို့ဆောင်ရေး သို့မဟုတ် မျဉ်းကြောင်းဆုတ်ယုတ်မှုကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်နည်း။

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။