စက်သင်ယူမှုတွင် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်း- အဓိပ္ပါယ်နှင့် ဥပမာ

အားဖြင့် Benjamin Anderson ဇူလိုင် 19, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

စက်သင်ယူမှုတွင်၊ အမျိုးအစားခွဲခွဲခြားမှုနှုန်း သည် အမျိုးအစားခွဲခြားမှုပုံစံ ဖြင့် မှားယွင်းစွာခန့်မှန်းထားသော လေ့လာတွေ့ရှိမှုရာခိုင်နှုန်းကို ပြောပြသည့် မက်ထရစ်တစ်ခုဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

Misclassification rate = # မမှန်ကန်သော ခန့်မှန်းချက်များ / စုစုပေါင်း ခန့်မှန်းချက် # ခု

မှားယွင်းသော အမျိုးအစားခွဲခြားမှုနှုန်း၏ တန်ဖိုးသည် 0 မှ 1 အထိ ကွဲပြားနိုင်သည်-

ဘ၀ကို ကိုယ်စားပြုသော မော်ဒယ်သည် မှားယွင်းသော ခန့်မှန်းချက်များ မရှိပါ။
1 သည် ခန့်မှန်းချက် လုံးဝမှားယွင်းနေသော မော်ဒယ်ကို ကိုယ်စားပြုသည်။

မှားယွင်းသောအမျိုးအစားခွဲခြားမှုနှုန်း၏တန်ဖိုးနိမ့်လေ၊ အမျိုးအစားခွဲခြားမှုပုံစံတစ်ခုသည် တုံ့ပြန်မှုကိန်းရှင် ၏ရလဒ်များကို ခန့်မှန်းနိုင်လေဖြစ်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် လက်တွေ့တွင် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ အတွက် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းကို တွက်ချက်နည်းကို ပြသထားသည်။

ဥပမာ- ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံအတွက် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းကို တွက်ချက်ခြင်း။

မတူညီသောကောလိပ်ဘတ်စကက်ဘောကစားသမား 400 ကို NBA သို့ရေးဆွဲမည်လား မခန့်မှန်းရန် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့အသုံးပြုသည်ဆိုပါစို့။

အောက်ဖော်ပြပါ ရှုပ်ထွေးမှု matrix သည် မော်ဒယ်မှ ပြုလုပ်သော ခန့်မှန်းချက်များကို အကျဉ်းချုပ်ဖော်ပြသည်-

ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ၏ မှားယွင်းသော အမျိုးအစားခွဲခြားမှုနှုန်းကို တွက်ချက်ပါ။

မော်ဒယ်အတွက် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းကို တွက်ချက်နည်းမှာ အောက်ပါအတိုင်း ဖြစ်ပါသည်။

Misclassification rate = # မမှန်ကန်သော ခန့်မှန်းချက်များ / စုစုပေါင်း ခန့်မှန်းချက် # ခု
အမျိုးအစားခွဲခြားမှု မှားယွင်းမှုနှုန်း = (မှားယွင်းသော အပြုသဘော + မှားယွင်းသော အနုတ်လက္ခဏာများ) / (စုစုပေါင်း ခန့်မှန်းချက်များ)
Misclassification rate = (70 + 40) / (400)
ခွဲခြားမှုနှုန်း = 0.275

ဤမော်ဒယ်အတွက် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းသည် 0.275 သို့မဟုတ် 27.5% ဖြစ်သည်။

ဆိုလိုသည်မှာ မော်ဒယ်သည် ကစားသမားများ၏ 27.5% အတွက် ရလဒ်ကို လွဲမှားစွာ ခန့်မှန်းထားခြင်းဖြစ်သည်။

အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်း၏ ဆန့်ကျင်ဘက်မှာ တိကျမှုရှိမည်ဖြစ်ပြီး၊ အောက်ပါအတိုင်း တွက်ချက်ထားသော

တိကျမှု = 1 – အမျိုးအစားခွဲခြားမှု မှားယွင်းမှုနှုန်း
တိကျမှု = 1 – 0.275
တိကျမှု = 0.725

ဆိုလိုသည်မှာ မော်ဒယ်သည် ကစားသမားများ၏ 72.5% အတွက် ရလဒ်ကို မှန်ကန်စွာ ခန့်မှန်းပေးသည်။

Misclassification Rate ၏ အားသာချက်များနှင့် အားနည်းချက်များ

မှားယွင်းသော အမျိုးအစားခွဲခြားမှုနှုန်းသည် အောက်ပါ အကျိုးကျေးဇူးများကို ပေးဆောင်သည်-

အဓိပ္ပာယ်ဖွင့်ဆိုရန်လွယ်ကူသည် ။ အမျိုးအစားခွဲခြားမှုနှုန်း 10% ၏အမှားအယွင်းတစ်ခုသည် မော်ဒယ်တစ်ခုသည် စုစုပေါင်းလေ့လာသုံးသပ်မှု၏ 10% အတွက် မှားယွင်းသောခန့်မှန်းချက်တစ်ခုကို ပြုလုပ်ခဲ့သည်ဟု ဆိုလိုသည်။
တွက်ချက်ရန်လွယ်ကူသည် ။ ခန့်မှန်းချက် စုစုပေါင်းအရေအတွက်ဖြင့် ပိုင်းခြားထားသော မှားယွင်းသော ခန့်မှန်းချက်များ စုစုပေါင်းအရေအတွက်အဖြစ် မှားယွင်းသော အမျိုးအစားခွဲခြားမှုနှုန်းကို တွက်ချက်ပါသည်။

သို့သော်၊ အမျိုးအစားခွဲခြားမှု မှားယွင်းမှုနှုန်းတွင် အောက်ပါ အားနည်းချက်များ ရှိသည်။

ဒေတာဖြန့်ဝေပုံကို ထည့်သွင်းစဉ်းစားမည်မဟုတ်ပါ ။ ဥပမာအားဖြင့်၊ ကစားသမားအားလုံး၏ 90% သည် NBA သို့မသတ်မှတ်ထားကြောင်း ယူဆကြပါစို့။ အကယ်၍ ကစားသမားတိုင်းသည် အကြမ်းမဖက်ဘဲနေမည်ဟု ရိုးရိုးရှင်းရှင်း ခန့်မှန်းထားသော မော်ဒယ်တစ်ခုရှိပါက၊ မော်ဒယ်တွင် အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းမှာ 10% သာရှိသည်။ ၎င်းသည် နည်းပါးပုံရသော်လည်း မော်ဒယ်သည် အမှန်တကယ် ရေးဆွဲမည့် ကစားသမားကို မှန်ကန်စွာ ခန့်မှန်းနိုင်ခြင်းမရှိပေ။

လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်၏ အမျိုးအစားခွဲခြားမှု အမှားအယွင်းနှုန်းကို အခြားသော မက်ထရစ်များဖြစ်သည့်-

အာရုံခံစားနိုင်မှု – “ စစ်မှန်သော အပြုသဘောဆောင်နှုန်း” – မော်ဒယ်က ရှာဖွေတွေ့ရှိနိုင်သည့် အပြုသဘောဆောင်သည့် ရလဒ်များ၏ ရာခိုင်နှုန်း။
တိကျမှု – “ စစ်မှန်သော အနုတ်လက္ခဏာနှုန်း” – မော်ဒယ်က ရှာဖွေတွေ့ရှိနိုင်သည့် အနုတ်လက္ခဏာရလဒ်များ၏ ရာခိုင်နှုန်း။
F1 ရမှတ် – ဒေတာဖြန့်ဝေပုံနှင့် နှိုင်းယှဉ်ပါက မော်ဒယ်တစ်ခု မည်မျှတိကျကြောင်း ကျွန်ုပ်တို့အားပြောပြသော မက်ထရစ် တစ်ခု။

ဤမက်ထရစ်တစ်ခုစီ၏တန်ဖိုးကို တွက်ချက်ခြင်းဖြင့်၊ မော်ဒယ်သည် ခန့်မှန်းချက်များကို မည်မျှ ကောင်းမွန်စွာ ပြုလုပ်နိုင်သည်ကို ကျွန်ုပ်တို့ အပြည့်အဝ နားလည်နိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ဘုံစက်သင်ယူခြင်းဆိုင်ရာ သဘောတရားများဆိုင်ရာ နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-

Logistic Regression နိဒါန်း
မျှတသောတိကျမှုဟူသည် အဘယ်နည်း။
F1 ရမှတ်နှင့် တိကျမှု- မည်သည့်အရာကို အသုံးပြုသင့်သနည်း။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

Misclassification Rate ၏ အားသာချက်များနှင့် အားနည်းချက်များ

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။