"ကောင်းမှု" ဆိုတာ ဘာလဲ။ စက်သင်ယူမှုမော်ဒယ်များအတွက် တိကျမှုရှိပါသလား။
စက်သင်ယူမှုတွင် အမျိုးအစားခွဲခြင်းပုံစံများကို အသုံးပြုသည့်အခါ၊ မော်ဒယ်တစ်ခု၏အရည်အသွေးကို အကဲဖြတ်ရန် ကျွန်ုပ်တို့မကြာခဏအသုံးပြုလေ့ရှိသည့် မက်ထရစ်တစ်ခုမှာ တိကျမှု ဖြစ်သည်။
တိကျမှုဆိုသည်မှာ မော်ဒယ်ဖြင့် မှန်ကန်စွာ ခွဲခြားထားသော လေ့လာတွေ့ရှိချက်အားလုံး၏ ရာခိုင်နှုန်းဖြစ်သည်။
အောက်ပါအတိုင်း တွက်ချက်သည်။
တိကျမှု = (#မှန်ကန်သော အပြုသဘော + အစစ်အမှန် အနုတ်လက္ခဏာများ) / (စုစုပေါင်း နမူနာအရွယ်အစား)
ကျောင်းသားများ မကြာခဏမေးလေ့ရှိသော မေးခွန်းတစ်ခုသည် တိကျမှု၊
စက်သင်ယူမှုပုံစံ၏တိကျမှုအတွက် “ ကောင်းသော” တန်ဖိုးဟု အဘယ်အရာက ယူဆသနည်း။
မော်ဒယ်တစ်ခု၏ တိကျမှုသည် 0% နှင့် 100% အကြား ကွဲပြားနိုင်သော်လည်း မော်ဒယ်တစ်ခုတွင် “ ကောင်း” တိကျမှုရှိမရှိ ဆုံးဖြတ်ရန် ကျွန်ုပ်တို့အသုံးပြုသော universal threshold မရှိပါ။
ယင်းအစား၊ ကျွန်ုပ်တို့သည် ပုံမှန်အားဖြင့် ကျွန်ုပ်တို့၏ မော်ဒယ်၏ တိကျမှုကို ရည်ညွှန်းသည့် မော်ဒယ်တစ်ခုနှင့် နှိုင်းယှဉ်ပါသည်။
ဒေတာအတွဲတစ်ခုရှိ စူးစမ်းလေ့လာမှုတစ်ခုစီသည် အသုံးအများဆုံးအတန်းနှင့် သက်ဆိုင်ကြောင်း အခြေခံမျဉ်းပုံစံတစ်ခုက ရိုးရိုးရှင်းရှင်း ခန့်မှန်းသည်။
လက်တွေ့တွင်၊ ရည်ညွှန်းမော်ဒယ်ထက် ပိုမိုတိကျသော အမျိုးအစားခွဲခြင်းပုံစံကို “ အသုံးဝင်သည်” ဟု ယူဆနိုင်သော်လည်း ကျွန်ုပ်တို့၏ မော်ဒယ်နှင့် ရည်ညွှန်းမော်ဒယ်ကြားတွင် တိကျမှုကွာခြားမှု ပိုများလေလေ၊ ပိုကောင်းလေဖြစ်သည်။
အောက်ပါဥပမာသည် အမျိုးအစားခွဲခြားမှုပုံစံတစ်ခုတွင် “ ကောင်း” တိကျမှုရှိမရှိ အကြမ်းဖျင်းဆုံးဖြတ်နည်းကို ပြသထားသည်။
ဥပမာ- မော်ဒယ်တစ်ခုတွင် “ ကောင်း” တိကျမှုရှိမရှိ ဆုံးဖြတ်ခြင်း။
မတူညီသောကောလိပ်ဘတ်စကက်ဘောကစားသမား 400 ကို NBA သို့ရေးဆွဲမည်လား မခန့်မှန်းရန် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့အသုံးပြုသည်ဆိုပါစို့။
အောက်ဖော်ပြပါ ရှုပ်ထွေးမှု matrix သည် မော်ဒယ်မှ ပြုလုပ်သော ခန့်မှန်းချက်များကို အကျဉ်းချုပ်ဖော်ပြသည်-

ဤမော်ဒယ်၏ တိကျမှုကို တွက်ချက်နည်းမှာ အောက်ပါအတိုင်းဖြစ်သည်-
- တိကျမှု = (#မှန်ကန်သော အပြုသဘော + အစစ်အမှန် အနုတ်လက္ခဏာများ) / (စုစုပေါင်း နမူနာအရွယ်အစား)
- တိကျမှု = (၁၂၀ + ၁၇၀) / (၄၀၀)၊
- တိကျမှု = 0.725
မော်ဒယ်သည် ကစားသမားများ၏ 72.5% အတွက် ရလဒ်ကို မှန်ကန်စွာ ခန့်မှန်းခဲ့သည်။
တိကျမှန်ကန်မှု “ ကောင်း” ရှိမရှိ အကြံဥာဏ်ရယူရန်အတွက် အခြေခံစံနမူနာတစ်ခု၏ တိကျမှုကို တွက်ချက်နိုင်ပါသည်။
ဤဥပမာတွင်၊ ကစားသမားများအတွက် အသုံးအများဆုံးရလဒ်မှာ မူကြမ်းမရေးဆွဲဘဲ ဖြစ်နေသည်။ အထူးသဖြင့် ကစားသမား 400 တွင် 240 သည် မူကြမ်းကို မရေးဆွဲရသေးပါ။
အခြေခံပုံစံသည် ကစားသမားတစ်ဦးစီသည် အကြမ်းမဖက်ဘဲနေမည်ကို ရိုးရိုးရှင်းရှင်း ခန့်မှန်းပေးသည့်ပုံစံတစ်ခုဖြစ်သည်။
ဤမော်ဒယ်၏ တိကျမှုကို အောက်ပါအတိုင်း တွက်ချက်ရမည်ဖြစ်ပါသည်။
- တိကျမှု = (#မှန်ကန်သော အပြုသဘော + အစစ်အမှန် အနုတ်လက္ခဏာများ) / (စုစုပေါင်း နမူနာအရွယ်အစား)
- တိကျမှု = (0+240)/(400)၊
- တိကျမှု = 0.6
ဤအခြေခံပုံစံသည် ကစားသမားများ၏ 60% အတွက် ရလဒ်ကို မှန်ကန်စွာ ခန့်မှန်းနိုင်မည်ဖြစ်သည်။
ဤအခြေအနေတွင်၊ ကျွန်ုပ်တို့၏ logistic regression model သည် အခြေခံမော်ဒယ်တစ်ခုထက် တိကျသေချာသောတိုးတက်မှုကို ပေးစွမ်းသောကြောင့် ကျွန်ုပ်တို့၏မော်ဒယ်သည် အနည်းဆုံး “ အသုံးဝင်သည်” ဟု မှတ်ယူပါသည်။
လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် မတူညီသော အမျိုးအစားခွဲခြားမှု မော်ဒယ်များစွာကို အံဝင်ခွင်ကျဖြစ်နိုင်ပြီး အခြေခံမျဥ်းပုံစံနှင့် နှိုင်းယှဉ်ပါက တိကျမှုအများဆုံးရရှိစေမည့် နောက်ဆုံးမော်ဒယ်ကို ရွေးချယ်ပါ။
မော်ဒယ်စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန် တိကျမှုကို အသုံးပြုခြင်းအတွက် ကြိုတင်ကာကွယ်မှုများ
တိကျမှုဆိုသည်မှာ အဓိပ္ပာယ်ဖွင့်ဆိုရလွယ်ကူသောကြောင့် အသုံးများသော မက်ထရစ်တစ်ခုဖြစ်သည်။
ဥပမာအားဖြင့်၊ မော်ဒယ်တစ်ခုသည် 90% တိကျသည်ဟု ဆိုပါက၊ ၎င်းသည် လေ့လာတွေ့ရှိချက်များ၏ 90% ကို မှန်ကန်စွာ ခွဲခြားထားကြောင်း ကျွန်ုပ်တို့သိပါသည်။
သို့သော် တိကျမှန်ကန်မှုသည် ဒေတာဖြန့်ဝေပုံကို ထည့်သွင်းစဉ်းစားမည်မဟုတ်ပါ။
ဥပမာအားဖြင့်၊ ကစားသမားအားလုံး၏ 90% သည် NBA သို့မသတ်မှတ်ထားကြောင်း ယူဆကြပါစို့။ အကယ်၍ ကစားသမားတိုင်းသည် အကြမ်းမဖက်ဘဲနေမည်ဟု ရိုးရိုးရှင်းရှင်း ခန့်မှန်းထားသည့် မော်ဒယ်တစ်ခုရှိလျှင် မော်ဒယ်သည် ကစားသမားများ၏ 90% အတွက် ရလဒ်ကို မှန်ကန်စွာ ခန့်မှန်းပေးမည်ဖြစ်သည်။
ဤတန်ဖိုးသည် မြင့်မားပုံရသည်၊ သို့သော် မည်သည့်ကစားသမားများ ရေးဆွဲမည်ကို မှန်ကန်စွာ ခန့်မှန်း၍မရသော မော်ဒယ်ဖြစ်သည်။
မကြာခဏအသုံးပြုလေ့ရှိသော အခြားမက်ထရစ်တစ်ခုကို F1 Score ဟုခေါ်သည်၊ ၎င်းသည် ဒေတာဖြန့်ဝေပုံကို ထည့်သွင်းစဉ်းစားသည်။
ဥပမာအားဖြင့်၊ ဒေတာသည် အလွန်မျှတမှုမရှိပါက (ဥပမာ ကစားသမားအားလုံး၏ 90% သည် မရေးဆွဲရသေးဘဲ 10% ဖြစ်သည်)၊ ထို့နောက် F1 ရမှတ်သည် မော်ဒယ်၏စွမ်းဆောင်ရည်ကို ပိုမိုကောင်းမွန်စွာ အကဲဖြတ်ပေးမည်ဖြစ်ပါသည်။
တိကျမှုနှင့် F1 ရမှတ်အကြား ခြားနားချက်များကို ဤနေရာတွင် လေ့လာပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် စက်သင်ယူမှု အမျိုးအစားခွဲခြင်းပုံစံများတွင် အသုံးပြုသည့် မက်ထရစ်များအကြောင်း နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-
မျှတသောတိကျမှုဟူသည် အဘယ်နည်း။
‘ကောင်း’ F1 ရမှတ်ကို ဘာက သတ်မှတ်တာလဲ။