"ကောင်းမှု" ဆိုတာ ဘာလဲ။ စက်သင်ယူမှုမော်ဒယ်များအတွက် တိကျမှုရှိပါသလား။


စက်သင်ယူမှုတွင် အမျိုးအစားခွဲခြင်းပုံစံများကို အသုံးပြုသည့်အခါ၊ မော်ဒယ်တစ်ခု၏အရည်အသွေးကို အကဲဖြတ်ရန် ကျွန်ုပ်တို့မကြာခဏအသုံးပြုလေ့ရှိသည့် မက်ထရစ်တစ်ခုမှာ တိကျမှု ဖြစ်သည်။

တိကျမှုဆိုသည်မှာ မော်ဒယ်ဖြင့် မှန်ကန်စွာ ခွဲခြားထားသော လေ့လာတွေ့ရှိချက်အားလုံး၏ ရာခိုင်နှုန်းဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

တိကျမှု = (#မှန်ကန်သော အပြုသဘော + အစစ်အမှန် အနုတ်လက္ခဏာများ) / (စုစုပေါင်း နမူနာအရွယ်အစား)

ကျောင်းသားများ မကြာခဏမေးလေ့ရှိသော မေးခွန်းတစ်ခုသည် တိကျမှု၊

စက်သင်ယူမှုပုံစံ၏တိကျမှုအတွက် “ ကောင်းသော” တန်ဖိုးဟု အဘယ်အရာက ယူဆသနည်း။

မော်ဒယ်တစ်ခု၏ တိကျမှုသည် 0% နှင့် 100% အကြား ကွဲပြားနိုင်သော်လည်း မော်ဒယ်တစ်ခုတွင် “ ကောင်း” တိကျမှုရှိမရှိ ဆုံးဖြတ်ရန် ကျွန်ုပ်တို့အသုံးပြုသော universal threshold မရှိပါ။

ယင်းအစား၊ ကျွန်ုပ်တို့သည် ပုံမှန်အားဖြင့် ကျွန်ုပ်တို့၏ မော်ဒယ်၏ တိကျမှုကို ရည်ညွှန်းသည့် မော်ဒယ်တစ်ခုနှင့် နှိုင်းယှဉ်ပါသည်။

ဒေတာအတွဲတစ်ခုရှိ စူးစမ်းလေ့လာမှုတစ်ခုစီသည် အသုံးအများဆုံးအတန်းနှင့် သက်ဆိုင်ကြောင်း အခြေခံမျဉ်းပုံစံတစ်ခုက ရိုးရိုးရှင်းရှင်း ခန့်မှန်းသည်။

လက်တွေ့တွင်၊ ရည်ညွှန်းမော်ဒယ်ထက် ပိုမိုတိကျသော အမျိုးအစားခွဲခြင်းပုံစံကို “ အသုံးဝင်သည်” ဟု ယူဆနိုင်သော်လည်း ကျွန်ုပ်တို့၏ မော်ဒယ်နှင့် ရည်ညွှန်းမော်ဒယ်ကြားတွင် တိကျမှုကွာခြားမှု ပိုများလေလေ၊ ပိုကောင်းလေဖြစ်သည်။

အောက်ပါဥပမာသည် အမျိုးအစားခွဲခြားမှုပုံစံတစ်ခုတွင် “ ကောင်း” တိကျမှုရှိမရှိ အကြမ်းဖျင်းဆုံးဖြတ်နည်းကို ပြသထားသည်။

ဥပမာ- မော်ဒယ်တစ်ခုတွင် “ ကောင်း” တိကျမှုရှိမရှိ ဆုံးဖြတ်ခြင်း။

မတူညီသောကောလိပ်ဘတ်စကက်ဘောကစားသမား 400 ကို NBA သို့ရေးဆွဲမည်လား မခန့်မှန်းရန် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့အသုံးပြုသည်ဆိုပါစို့။

အောက်ဖော်ပြပါ ရှုပ်ထွေးမှု matrix သည် မော်ဒယ်မှ ပြုလုပ်သော ခန့်မှန်းချက်များကို အကျဉ်းချုပ်ဖော်ပြသည်-

ဤမော်ဒယ်၏ တိကျမှုကို တွက်ချက်နည်းမှာ အောက်ပါအတိုင်းဖြစ်သည်-

  • တိကျမှု = (#မှန်ကန်သော အပြုသဘော + အစစ်အမှန် အနုတ်လက္ခဏာများ) / (စုစုပေါင်း နမူနာအရွယ်အစား)
  • တိကျမှု = (၁၂၀ + ၁၇၀) / (၄၀၀)၊
  • တိကျမှု = 0.725

မော်ဒယ်သည် ကစားသမားများ၏ 72.5% အတွက် ရလဒ်ကို မှန်ကန်စွာ ခန့်မှန်းခဲ့သည်။

တိကျမှန်ကန်မှု “ ကောင်း” ရှိမရှိ အကြံဥာဏ်ရယူရန်အတွက် အခြေခံစံနမူနာတစ်ခု၏ တိကျမှုကို တွက်ချက်နိုင်ပါသည်။

ဤဥပမာတွင်၊ ကစားသမားများအတွက် အသုံးအများဆုံးရလဒ်မှာ မူကြမ်းမရေးဆွဲဘဲ ဖြစ်နေသည်။ အထူးသဖြင့် ကစားသမား 400 တွင် 240 သည် မူကြမ်းကို မရေးဆွဲရသေးပါ။

အခြေခံပုံစံသည် ကစားသမားတစ်ဦးစီသည် အကြမ်းမဖက်ဘဲနေမည်ကို ရိုးရိုးရှင်းရှင်း ခန့်မှန်းပေးသည့်ပုံစံတစ်ခုဖြစ်သည်။

ဤမော်ဒယ်၏ တိကျမှုကို အောက်ပါအတိုင်း တွက်ချက်ရမည်ဖြစ်ပါသည်။

  • တိကျမှု = (#မှန်ကန်သော အပြုသဘော + အစစ်အမှန် အနုတ်လက္ခဏာများ) / (စုစုပေါင်း နမူနာအရွယ်အစား)
  • တိကျမှု = (0+240)/(400)၊
  • တိကျမှု = 0.6

ဤအခြေခံပုံစံသည် ကစားသမားများ၏ 60% အတွက် ရလဒ်ကို မှန်ကန်စွာ ခန့်မှန်းနိုင်မည်ဖြစ်သည်။

ဤအခြေအနေတွင်၊ ကျွန်ုပ်တို့၏ logistic regression model သည် အခြေခံမော်ဒယ်တစ်ခုထက် တိကျသေချာသောတိုးတက်မှုကို ပေးစွမ်းသောကြောင့် ကျွန်ုပ်တို့၏မော်ဒယ်သည် အနည်းဆုံး “ အသုံးဝင်သည်” ဟု မှတ်ယူပါသည်။

လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် မတူညီသော အမျိုးအစားခွဲခြားမှု မော်ဒယ်များစွာကို အံဝင်ခွင်ကျဖြစ်နိုင်ပြီး အခြေခံမျဥ်းပုံစံနှင့် နှိုင်းယှဉ်ပါက တိကျမှုအများဆုံးရရှိစေမည့် နောက်ဆုံးမော်ဒယ်ကို ရွေးချယ်ပါ။

မော်ဒယ်စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန် တိကျမှုကို အသုံးပြုခြင်းအတွက် ကြိုတင်ကာကွယ်မှုများ

တိကျမှုဆိုသည်မှာ အဓိပ္ပာယ်ဖွင့်ဆိုရလွယ်ကူသောကြောင့် အသုံးများသော မက်ထရစ်တစ်ခုဖြစ်သည်။

ဥပမာအားဖြင့်၊ မော်ဒယ်တစ်ခုသည် 90% တိကျသည်ဟု ဆိုပါက၊ ၎င်းသည် လေ့လာတွေ့ရှိချက်များ၏ 90% ကို မှန်ကန်စွာ ခွဲခြားထားကြောင်း ကျွန်ုပ်တို့သိပါသည်။

သို့သော် တိကျမှန်ကန်မှုသည် ဒေတာဖြန့်ဝေပုံကို ထည့်သွင်းစဉ်းစားမည်မဟုတ်ပါ။

ဥပမာအားဖြင့်၊ ကစားသမားအားလုံး၏ 90% သည် NBA သို့မသတ်မှတ်ထားကြောင်း ယူဆကြပါစို့။ အကယ်၍ ကစားသမားတိုင်းသည် အကြမ်းမဖက်ဘဲနေမည်ဟု ရိုးရိုးရှင်းရှင်း ခန့်မှန်းထားသည့် မော်ဒယ်တစ်ခုရှိလျှင် မော်ဒယ်သည် ကစားသမားများ၏ 90% အတွက် ရလဒ်ကို မှန်ကန်စွာ ခန့်မှန်းပေးမည်ဖြစ်သည်။

ဤတန်ဖိုးသည် မြင့်မားပုံရသည်၊ သို့သော် မည်သည့်ကစားသမားများ ရေးဆွဲမည်ကို မှန်ကန်စွာ ခန့်မှန်း၍မရသော မော်ဒယ်ဖြစ်သည်။

မကြာခဏအသုံးပြုလေ့ရှိသော အခြားမက်ထရစ်တစ်ခုကို F1 Score ဟုခေါ်သည်၊ ၎င်းသည် ဒေတာဖြန့်ဝေပုံကို ထည့်သွင်းစဉ်းစားသည်။

ဥပမာအားဖြင့်၊ ဒေတာသည် အလွန်မျှတမှုမရှိပါက (ဥပမာ ကစားသမားအားလုံး၏ 90% သည် မရေးဆွဲရသေးဘဲ 10% ဖြစ်သည်)၊ ထို့နောက် F1 ရမှတ်သည် မော်ဒယ်၏စွမ်းဆောင်ရည်ကို ပိုမိုကောင်းမွန်စွာ အကဲဖြတ်ပေးမည်ဖြစ်ပါသည်။

တိကျမှုနှင့် F1 ရမှတ်အကြား ခြားနားချက်များကို ဤနေရာတွင် လေ့လာပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် စက်သင်ယူမှု အမျိုးအစားခွဲခြင်းပုံစံများတွင် အသုံးပြုသည့် မက်ထရစ်များအကြောင်း နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-

မျှတသောတိကျမှုဟူသည် အဘယ်နည်း။
‘ကောင်း’ F1 ရမှတ်ကို ဘာက သတ်မှတ်တာလဲ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်