စက်သင်ယူမှုတွင် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်း- အဓိပ္ပါယ်နှင့် ဥပမာ
စက်သင်ယူမှုတွင်၊ အမျိုးအစားခွဲခွဲခြားမှုနှုန်း သည် အမျိုးအစားခွဲခြားမှုပုံစံ ဖြင့် မှားယွင်းစွာခန့်မှန်းထားသော လေ့လာတွေ့ရှိမှုရာခိုင်နှုန်းကို ပြောပြသည့် မက်ထရစ်တစ်ခုဖြစ်သည်။
အောက်ပါအတိုင်း တွက်ချက်သည်။
Misclassification rate = # မမှန်ကန်သော ခန့်မှန်းချက်များ / စုစုပေါင်း ခန့်မှန်းချက် # ခု
မှားယွင်းသော အမျိုးအစားခွဲခြားမှုနှုန်း၏ တန်ဖိုးသည် 0 မှ 1 အထိ ကွဲပြားနိုင်သည်-
- ဘ၀ကို ကိုယ်စားပြုသော မော်ဒယ်သည် မှားယွင်းသော ခန့်မှန်းချက်များ မရှိပါ။
- 1 သည် ခန့်မှန်းချက် လုံးဝမှားယွင်းနေသော မော်ဒယ်ကို ကိုယ်စားပြုသည်။
မှားယွင်းသောအမျိုးအစားခွဲခြားမှုနှုန်း၏တန်ဖိုးနိမ့်လေ၊ အမျိုးအစားခွဲခြားမှုပုံစံတစ်ခုသည် တုံ့ပြန်မှုကိန်းရှင် ၏ရလဒ်များကို ခန့်မှန်းနိုင်လေဖြစ်သည်။
အောက်ဖော်ပြပါ ဥပမာသည် လက်တွေ့တွင် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ အတွက် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းကို တွက်ချက်နည်းကို ပြသထားသည်။
ဥပမာ- ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံအတွက် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းကို တွက်ချက်ခြင်း။
မတူညီသောကောလိပ်ဘတ်စကက်ဘောကစားသမား 400 ကို NBA သို့ရေးဆွဲမည်လား မခန့်မှန်းရန် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့အသုံးပြုသည်ဆိုပါစို့။
အောက်ဖော်ပြပါ ရှုပ်ထွေးမှု matrix သည် မော်ဒယ်မှ ပြုလုပ်သော ခန့်မှန်းချက်များကို အကျဉ်းချုပ်ဖော်ပြသည်-

မော်ဒယ်အတွက် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းကို တွက်ချက်နည်းမှာ အောက်ပါအတိုင်း ဖြစ်ပါသည်။
- Misclassification rate = # မမှန်ကန်သော ခန့်မှန်းချက်များ / စုစုပေါင်း ခန့်မှန်းချက် # ခု
- အမျိုးအစားခွဲခြားမှု မှားယွင်းမှုနှုန်း = (မှားယွင်းသော အပြုသဘော + မှားယွင်းသော အနုတ်လက္ခဏာများ) / (စုစုပေါင်း ခန့်မှန်းချက်များ)
- Misclassification rate = (70 + 40) / (400)
- ခွဲခြားမှုနှုန်း = 0.275
ဤမော်ဒယ်အတွက် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းသည် 0.275 သို့မဟုတ် 27.5% ဖြစ်သည်။
ဆိုလိုသည်မှာ မော်ဒယ်သည် ကစားသမားများ၏ 27.5% အတွက် ရလဒ်ကို လွဲမှားစွာ ခန့်မှန်းထားခြင်းဖြစ်သည်။
အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်း၏ ဆန့်ကျင်ဘက်မှာ တိကျမှုရှိမည်ဖြစ်ပြီး၊ အောက်ပါအတိုင်း တွက်ချက်ထားသော
- တိကျမှု = 1 – အမျိုးအစားခွဲခြားမှု မှားယွင်းမှုနှုန်း
- တိကျမှု = 1 – 0.275
- တိကျမှု = 0.725
ဆိုလိုသည်မှာ မော်ဒယ်သည် ကစားသမားများ၏ 72.5% အတွက် ရလဒ်ကို မှန်ကန်စွာ ခန့်မှန်းပေးသည်။
Misclassification Rate ၏ အားသာချက်များနှင့် အားနည်းချက်များ
မှားယွင်းသော အမျိုးအစားခွဲခြားမှုနှုန်းသည် အောက်ပါ အကျိုးကျေးဇူးများကို ပေးဆောင်သည်-
- အဓိပ္ပာယ်ဖွင့်ဆိုရန်လွယ်ကူသည် ။ အမျိုးအစားခွဲခြားမှုနှုန်း 10% ၏အမှားအယွင်းတစ်ခုသည် မော်ဒယ်တစ်ခုသည် စုစုပေါင်းလေ့လာသုံးသပ်မှု၏ 10% အတွက် မှားယွင်းသောခန့်မှန်းချက်တစ်ခုကို ပြုလုပ်ခဲ့သည်ဟု ဆိုလိုသည်။
- တွက်ချက်ရန်လွယ်ကူသည် ။ ခန့်မှန်းချက် စုစုပေါင်းအရေအတွက်ဖြင့် ပိုင်းခြားထားသော မှားယွင်းသော ခန့်မှန်းချက်များ စုစုပေါင်းအရေအတွက်အဖြစ် မှားယွင်းသော အမျိုးအစားခွဲခြားမှုနှုန်းကို တွက်ချက်ပါသည်။
သို့သော်၊ အမျိုးအစားခွဲခြားမှု မှားယွင်းမှုနှုန်းတွင် အောက်ပါ အားနည်းချက်များ ရှိသည်။
- ဒေတာဖြန့်ဝေပုံကို ထည့်သွင်းစဉ်းစားမည်မဟုတ်ပါ ။ ဥပမာအားဖြင့်၊ ကစားသမားအားလုံး၏ 90% သည် NBA သို့မသတ်မှတ်ထားကြောင်း ယူဆကြပါစို့။ အကယ်၍ ကစားသမားတိုင်းသည် အကြမ်းမဖက်ဘဲနေမည်ဟု ရိုးရိုးရှင်းရှင်း ခန့်မှန်းထားသော မော်ဒယ်တစ်ခုရှိပါက၊ မော်ဒယ်တွင် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းမှာ 10% သာရှိသည်။ ၎င်းသည် နည်းပါးပုံရသော်လည်း မော်ဒယ်သည် အမှန်တကယ် ရေးဆွဲမည့် ကစားသမားကို မှန်ကန်စွာ ခန့်မှန်းနိုင်ခြင်းမရှိပေ။
လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်၏ အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းကို အခြားသော မက်ထရစ်များဖြစ်သည့်-
- အာရုံခံစားနိုင်မှု – “ စစ်မှန်သော အပြုသဘောဆောင်နှုန်း” – မော်ဒယ်က ရှာဖွေတွေ့ရှိနိုင်သည့် အပြုသဘောဆောင်သည့် ရလဒ်များ၏ ရာခိုင်နှုန်း။
- တိကျမှု – “ စစ်မှန်သော အနုတ်လက္ခဏာနှုန်း” – မော်ဒယ်က ရှာဖွေတွေ့ရှိနိုင်သည့် အနုတ်လက္ခဏာရလဒ်များ၏ ရာခိုင်နှုန်း။
- F1 ရမှတ် – ဒေတာဖြန့်ဝေပုံနှင့် နှိုင်းယှဉ်ပါက မော်ဒယ်တစ်ခု မည်မျှတိကျကြောင်း ကျွန်ုပ်တို့အားပြောပြသော မက်ထရစ် တစ်ခု။
ဤမက်ထရစ်တစ်ခုစီ၏တန်ဖိုးကို တွက်ချက်ခြင်းဖြင့်၊ မော်ဒယ်သည် ခန့်မှန်းချက်များကို မည်မျှ ကောင်းမွန်စွာ ပြုလုပ်နိုင်သည်ကို ကျွန်ုပ်တို့ အပြည့်အဝ နားလည်နိုင်ပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ဘုံစက်သင်ယူခြင်းဆိုင်ရာ သဘောတရားများဆိုင်ရာ နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-
Logistic Regression နိဒါန်း
မျှတသောတိကျမှုဟူသည် အဘယ်နည်း။
F1 ရမှတ်နှင့် တိကျမှု- မည်သည့်အရာကို အသုံးပြုသင့်သနည်း။