ဆုတ်ယုတ်ခြင်း သို့မဟုတ် အမျိုးအစားခွဲခြားခြင်း- ကွာခြားချက်ကား အဘယ်နည်း။


စက်သင်ယူခြင်းဆိုင်ရာ အယ်လဂိုရီသမ်များကို သီးခြားအမျိုးအစား နှစ်မျိုးခွဲနိုင်သည်- ကြီးကြပ်ပြီး နှင့် ကြီးကြပ်မထားသော သင်ယူမှု အယ်လဂိုရီသမ်များ

ဆုတ်ယုတ်ခြင်း သို့မဟုတ် အမျိုးအစားခွဲခြင်း စက်သင်ယူမှု အယ်ဂိုရီသမ်

ကြီးကြပ်သင်ကြားမှုဆိုင်ရာ အယ်လဂိုရီသမ်များကို အမျိုးအစားနှစ်မျိုး ခွဲခြားနိုင်သည်-

1. Regression- တုံ့ပြန်မှုကိန်းရှင်သည် စဉ်ဆက်မပြတ်ဖြစ်သည်။

ဥပမာအားဖြင့်၊ တုံ့ပြန်မှုကိန်း ရှင်သည်-

  • အလေးချိန်
  • အရပ်အမြင့်
  • စျေးနှုန်း
  • အချိန်
  • စုစုပေါင်းယူနစ်

အခြေအနေတိုင်းတွင်၊ ဆုတ်ယုတ်မှုပုံစံတစ်ခုသည် စဉ်ဆက်မပြတ်ပမာဏကို ခန့်မှန်းရန်ရှာသည်။

ဆုတ်ယုတ်မှု ဥပမာ-

ကျွန်ုပ်တို့တွင် မတူညီသောအိမ် 100 အတွက် ကွဲလွဲချက်သုံးမျိုးပါရှိသော ဒေတာအစုံရှိသည်- စတုရန်းပေ၊ ရေချိုးခန်းအရေအတွက်နှင့် အရောင်းစျေးနှုန်း။

တုံ့ပြန်မှုကိန်းရှင်အဖြစ် ရှင်းလင်းချက်ပြောင်းနိုင်သောကိန်းရှင်များနှင့် အရောင်းစျေးနှုန်းများအဖြစ် စတုရန်းပုံနှင့် ရေချိုးခန်းအရေအတွက်တို့ကို အသုံးပြုသည့် ဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့ အံဝင်ခွင်ကျဖြစ်စေနိုင်သည်။

ထို့နောက် ၎င်း၏စတုရန်းပုံနှင့် ရေချိုးခန်းအရေအတွက်ပေါ်မူတည်၍ အိမ်တစ်အိမ်၏ရောင်းစျေးကို ခန့်မှန်းရန် ဤပုံစံကို အသုံးပြုနိုင်သည်။

တုံ့ပြန်မှုမပြောင်းလဲနိုင်သော (အရောင်းစျေးနှုန်း) သည် အဆက်မပြတ်ဖြစ်နေသောကြောင့် ဆုတ်ယုတ်မှုပုံစံ၏ ဥပမာတစ်ခုဖြစ်သည်။

ဆုတ်ယုတ်မှုပုံစံတစ်ခု၏ တိကျမှုကို တိုင်းတာရန် အသုံးအများဆုံးနည်းလမ်းမှာ ပျမ်းမျှအားဖြင့် ကျွန်ုပ်တို့၏ခန့်မှန်းထားသောတန်ဖိုးများသည် မော်ဒယ်တစ်ခုရှိ ကျွန်ုပ်တို့၏လေ့လာတွေ့ရှိထားသည့်တန်ဖိုးများနှင့် မည်မျှကွာဝေးသည်ကို ပြောပြသည့် root mean square error (RMSE) ကို တွက်ချက်ရန်ဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။

RMSE = √ Σ(P i – O i ) 2 / n

ရွှေ-

  • ∑ သည် “ပေါင်း” ဟု အဓိပ္ပါယ်ရသော ဖန်စီသင်္ကေတတစ်ခုဖြစ်သည်။
  • P i သည် IT Observation အတွက် ခန့်မှန်းတန်ဖိုးဖြစ်သည်။
  • O i သည် ith observation အတွက် မှတ်သားထားသော တန်ဖိုးဖြစ်သည်။
  • n သည် နမူနာအရွယ်အစားဖြစ်သည်။

RMSE သေးငယ်လေ၊ ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာကို အံဝင်ခွင်ကျဖြစ်စေနိုင်လေဖြစ်သည်။

2. အမျိုးအစားခွဲခြားခြင်း- တုံ့ပြန်မှုကိန်းရှင်သည် အမျိုးအစားခွဲခြားသည်။

ဥပမာအားဖြင့်၊ တုံ့ပြန်မှုကိန်းရှင်သည် အောက်ပါတန်ဖိုးများကို ယူနိုင်သည်။

  • ကျားသို့မဟုတ်မ
  • အောင်မြင်သည်ဖြစ်စေ ကျရှုံးသည်
  • အနိမ့်၊ အလတ် သို့မဟုတ် အမြင့်

ကိစ္စတစ်ခုစီတွင်၊ အမျိုးအစားခွဲခြားမှုပုံစံတစ်ခုသည် အတန်းတံဆိပ်တစ်ခုကို ခန့်မှန်းရန်ရှာသည်။

အမျိုးအစားခွဲခြားခြင်း၏ဥပမာ

ကျွန်ုပ်တို့တွင် မတူညီသောကောလိပ်ဘတ်စကက်ဘောကစားသမား 100 အတွက် variable သုံးခုပါရှိသော ဒေတာအစုံရှိသည်- ဂိမ်းပျမ်းမျှနှုန်း၊ ပိုင်းခြားမှုအဆင့်နှင့် ၎င်းတို့ကို NBA သို့ ရေးဆွဲသည်ဖြစ်စေ မရေးဆွဲသည်ဖြစ်စေ။

ကျွန်ုပ်တို့သည် ဂိမ်းတစ်ခုလျှင် ပျမ်းမျှရမှတ်များနှင့် ပိုင်းခြားမှုအဆင့်အလိုက် အမျိုးအစားခွဲခြားမှုပုံစံကို ရှင်းလင်းချက်ပြောင်းနိုင်သောကိန်းရှင်များအဖြစ် ပြောင်းလဲကာ တုံ့ပြန်မှုကိန်းရှင်အဖြစ် “ ရေးဆွဲထားသည်” ကို ပြုပြင်ပြောင်းလဲနိုင်ပါသည်။

ထို့နောက် ပေးထားသောကစားသမားသည် ဂိမ်းပျမ်းမျှနှင့် ပိုင်းခြားမှုအဆင့်အလိုက် အမှတ်အလိုက် NBA သို့ ရေးဆွဲမည်လား မခန့်မှန်းရန် ဤပုံစံကို ကျွန်ုပ်တို့အသုံးပြုနိုင်ပါသည်။

တုံ့ပြန်မှုမပြောင်းလဲနိုင်သော (“ရေးထားသည်”) သည် အမျိုးအစားခွဲခြားထားသောကြောင့် အမျိုးအစားခွဲခြားမှုပုံစံ၏ ဥပမာတစ်ခုဖြစ်သည်။ တစ်နည်းဆိုရသော်၊ ၎င်းသည် မတူညီသော အမျိုးအစားနှစ်ခုတွင် တန်ဖိုးများကိုသာ ယူနိုင်သည်- “ ရေးသားထားသည်” သို့မဟုတ် “ မရေးဆွဲရသေးသော” ။

အမျိုးအစားခွဲခြားမှုပုံစံတစ်ခု၏ တိကျမှုကို တိုင်းတာရန် အသုံးအများဆုံးနည်းလမ်းမှာ မော်ဒယ်မှပြုလုပ်သော မှန်ကန်သောအမျိုးအစားခွဲခြားမှုရာခိုင်နှုန်းကို တွက်ချက်ရန်ဖြစ်သည်။

တိကျမှု = အမှားပြင်ဆင်ခြင်း အမျိုးအစားခွဲခြင်း/ အမျိုးအစားခွဲခြင်း ကြိုးစားမှု စုစုပေါင်းအရေအတွက် * 100%

ဥပမာအားဖြင့်၊ ကစားသမားတစ်ဦးသည် ဖြစ်နိုင်ချေ အကြိမ် 100 အနက် NBA 88 တွင် အကြိမ် 88 ကြိမ်ရေးဆွဲမည်၊ မဟုတ်သည်ကို မော်ဒယ်တစ်ခု မှန်ကန်စွာ ခွဲခြားသတ်မှတ်ပါက၊ မော်ဒယ်၏ တိကျမှုသည်-

တိကျမှု = (88/100) * 100% = 88%

တိကျမှုမြင့်မားလေ၊ အမျိုးအစားခွဲခြားမှုပုံစံတစ်ခုသည် ရလဒ်များကို ကြိုတင်ခန့်မှန်းနိုင်လေဖြစ်သည်။

Regression နှင့် Classification အကြား တူညီမှုများ

Regression နှင့် classification algorithms များသည် အောက်ပါနည်းလမ်းများဖြင့် ဆင်တူပါသည်။

  • နှစ်ခုစလုံးသည် ကြီးကြပ်သင်ကြားမှု အယ်လဂိုရီသမ်များဖြစ်သည်၊ ဆိုလိုသည်မှာ ၎င်းတို့နှစ်ဦးစလုံးသည် တုံ့ပြန်မှုပြောင်းလဲနိုင်သော ကိန်းရှင်တစ်ခုပါရှိသည်။
  • နှစ်ခုလုံးသည် တုံ့ပြန်မှုကို ခန့်မှန်းရန် မော်ဒယ်များ ဖန်တီးရန် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပို သော ရှင်းပြချက်တစ်ခုကို အသုံးပြုသည်။
  • နှစ်ခုလုံးသည် တုံ့ပြန်မှုကိန်းရှင်၏ တန်ဖိုးများကို မည်ကဲ့သို့ ပြောင်းလဲစေသည်ကို နားလည်ရန် အသုံးပြုနိုင်သည်။

ဆုတ်ယုတ်ခြင်းနှင့် အမျိုးအစားခွဲခြားခြင်းကြား ကွာခြားချက်များ

ဆုတ်ယုတ်ခြင်းနှင့် အမျိုးအစားခွဲခြင်းဆိုင်ရာ အယ်လဂိုရီသမ်များသည် အောက်ပါနည်းလမ်းများဖြင့် ကွဲပြားသည်-

  • Regression algorithms များသည် စဉ်ဆက်မပြတ် အရေအတွက်နှင့် အမျိုးအစားခွဲခြင်းဆိုင်ရာ အယ်လဂိုရီသမ်များကို ခန့်မှန်းရန် ကြိုးပမ်းပြီး အတန်းတံဆိပ်တစ်ခုကို ခန့်မှန်းရန် ရှာဖွေသည်။
  • ဆုတ်ယုတ်မှု၏ တိကျမှုနှင့် အမျိုးအစားခွဲခြားမှုပုံစံများကို ကျွန်ုပ်တို့တိုင်းတာပုံ ကွဲပြားသည်။

ဆုတ်ယုတ်မှုကို အမျိုးအစားခွဲခြားခြင်းသို့ ပြောင်းလဲခြင်း။

တုံ့ပြန်မှုကိန်းရှင်ကို အပိုင်းများအဖြစ် ပိုင်းခြားသတ်မှတ်ခြင်း ဖြင့် ဆုတ်ယုတ်မှုပြဿနာကို အမျိုးအစားခွဲခြားခြင်းပြဿနာအဖြစ်သို့ ပြောင်းလဲနိုင်သည်ကို သတိပြုသင့်သည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် စတုရန်းပုံ၊ ရေချိုးခန်းအရေအတွက်နှင့် အရောင်းစျေးနှုန်းဟူ၍ ကွဲလွဲချက် သုံးခုပါဝင်သည့် ဒေတာအစုံရှိသည် ဆိုကြပါစို့။

အရောင်းစျေးနှုန်းများကို ခန့်မှန်းရန် စတုရန်းပုံနှင့် ရေချိုးခန်းအရေအတွက်တို့ကို အသုံးပြု၍ ဆုတ်ယုတ်မှုပုံစံကို တည်ဆောက်နိုင်သည်။

သို့သော်၊ ကျွန်ုပ်တို့သည် အရောင်းစျေးနှုန်းကို အမျိုးအစားသုံးမျိုးဖြင့် ခွဲခြားနိုင်သည်-

  • $80,000 မှ $160,000 – “ရောင်းစျေးလျော့”
  • $161,000 – $240,000: “ပျမ်းမျှရောင်းဈေး”
  • $241,000 – $320,000: “ရောင်းဈေးမြင့်”

ထို့နောက် ပေးထားသောအိမ်၏ရောင်းစျေးသည် မည်သည့်အတန်း (အနိမ့်၊ အလတ်၊ သို့မဟုတ် အမြင့်) သို့ ကျမည်ကို ခန့်မှန်းရန် လေးထောင့်ပုံနှင့် ရေချိုးခန်း အရေအတွက်ကို ရှင်းလင်းချက်ပြောင်းနိုင်သော ကိန်းရှင်များအဖြစ် အသုံးပြုနိုင်သည်။

အိမ်တစ်အိမ်စီကို အတန်းတစ်ခုအဖြစ် သတ်မှတ်ရန် ကြိုးစားနေသောကြောင့် အမျိုးအစားခွဲခြားမှုပုံစံ၏ ဥပမာတစ်ခုဖြစ်သည်။

အကျဉ်းချုပ်

အောက်ဖော်ပြပါဇယားသည် ဆုတ်ယုတ်ခြင်းနှင့် အမျိုးအစားခွဲခြင်းဆိုင်ရာ အယ်လဂိုရီသမ်များကြားရှိ ဆင်တူမှုများနှင့် ကွာခြားချက်များကို အကျဉ်းချုပ်ဖော်ပြသည်-

ဆုတ်ယုတ်ခြင်းနှင့် အမျိုးအစားခွဲခြားခြင်းကြား ကွာခြားချက်များ

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်