Roc curve (ဥပမာများနှင့်အတူ) အဓိပါယ်ဖွင့်နည်း
Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model တစ်ခုနှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့အသုံးပြုသည့် ကိန်းဂဏန်းဆိုင်ရာ နည်းလမ်းတစ်ခုဖြစ်သည်။ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း အကဲဖြတ်ရန်၊ အောက်ပါ မက်ထရစ်နှစ်ခုကို ကြည့်နိုင်သည်-
- အာရုံခံစားနိုင်မှု- ရလဒ်အမှန်တကယ်အပြုသဘောဆောင်သောအခါတွင် လေ့လာမှုတစ်ခုအတွက် အပြုသဘောဆောင်သောရလဒ်ကို မော်ဒယ်က ခန့်မှန်းပေးသည့်ဖြစ်နိုင်ခြေ။
- တိကျမှု- ရလဒ်အမှန်တကယ် အနုတ်လက္ခဏာဖြစ်သောအခါ လေ့လာမှုတစ်ခုအတွက် အနုတ်ရလဒ်ကို မော်ဒယ်က ခန့်မှန်းပေးသည့် ဖြစ်နိုင်ခြေ။
ဤမက်ထရစ်နှစ်ခုကို မြင်သာစေရန် ရိုးရှင်းသောနည်းလမ်းမှာ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ၏ အာရုံခံနိုင်စွမ်းနှင့် တိကျမှုကိုပြသသည့် ဂရပ်တစ်ခုဖြစ်သည့် ROC မျဉ်းကွေးကို ဖန်တီးရန်ဖြစ်သည်။

ဤသင်ခန်းစာတွင် ROC မျဉ်းကွေးတစ်ခုကို ဖန်တီးပြီး အဓိပ္ပာယ်ဖွင့်နည်းကို ရှင်းပြထားသည်။
ROC Curve ဖန်တီးနည်း
ကျွန်ုပ်တို့သည် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို တပ်ဆင်ပြီးသည်နှင့်၊ ကျွန်ုပ်တို့သည် စူးစမ်းလေ့လာမှုများကို အမျိုးအစားနှစ်မျိုးထဲမှ တစ်ခုအဖြစ် အမျိုးအစားခွဲခြားရန် မော်ဒယ်ကို အသုံးပြုနိုင်ပါသည်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် ရှုမြင်သုံးသပ်ချက်များကို “ အပြုသဘော” သို့မဟုတ် “ အနုတ်လက္ခဏာ” အဖြစ် ခွဲခြားနိုင်သည်။
စစ်မှန်သော အပြုသဘောဆောင်သည့်နှုန်းသည် လက်တွေ့တွင် အပြုသဘောဖြစ်သင့်သည့် ရှုမြင်မှုအချိုးအစားကို ကိုယ်စားပြုသည်။
အပြန်အလှန်အားဖြင့်၊ မှားယွင်းသောအပြုသဘောနှုန်းသည် အပြုသဘောဖြစ်သင့်သော်လည်း အမှန်တကယ်တွင် အနုတ်လက္ခဏာဖြစ်သင့်သည့် ရှုမြင်မှုအချိုးအစားကို ကိုယ်စားပြုသည်။
ROC မျဉ်းကွေးကို ဖန်တီးသောအခါ၊ ထောက်ပံ့ပို့ဆောင်မှု ဆုတ်ယုတ်မှုပုံစံ၏ ဖြစ်နိုင်သည့် ဆုံးဖြတ်ချက်အဆင့်တစ်ခုစီအတွက် စစ်မှန်သော အပြုသဘောနှုန်းနှင့် မှားယွင်းသော အပြုသဘောနှုန်းအတွဲများကို တွက်ချက်သည်။

ROC မျဉ်းကွေးကို ဘယ်လိုအဓိပ္ပာယ်ဖွင့်မလဲ။
ROC မျဉ်းကွေးသည် ကွက်ကွက်၏ ဘယ်ဘက်အပေါ်ထောင့်နှင့် ပိုမိုနီးကပ်လေလေ၊ မော်ဒယ်သည် အချက်အလက်များကို အမျိုးအစားများခွဲခြားနိုင်လေလေဖြစ်သည်။
၎င်းကို တွက်ချက်ရန်အတွက် AUC (မျဉ်းကွေးအောက်တွင် ဧရိယာ) ကို တွက်ချက်နိုင်ပြီး ကွက်ကွက်၏ မျဉ်းကွေးအောက်တွင် မည်မျှရှိသည်ကို ပြောပြသည်။

AUC က 1 နဲ့ ပိုနီးစပ်လေ၊ model က ပိုကောင်းပါတယ်။
0.5 နှင့် ညီမျှသော AUC ပါသော မော်ဒယ်သည် ပြီးပြည့်စုံသော ထောင့်ဖြတ်မျဉ်းဖြစ်မည်ဖြစ်ပြီး ကျပန်းအမျိုးအစားခွဲခြားမှုပြုလုပ်သည့် မော်ဒယ်ထက်သာလွန်သော မော်ဒယ်ကို ကိုယ်စားပြုမည်ဖြစ်သည်။

ကြိုတင်ခန့်မှန်းမှုပြုလုပ်ရာတွင် ဘယ်မော်ဒယ်က အကောင်းဆုံးလဲဆိုတာ သိနိုင်စေတဲ့အတွက် များစွာသော logistic regression မော်ဒယ်များအတွက် AUC ကို တွက်ချက်ရန် အထူးအသုံးဝင်ပါသည်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် မတူညီသော logistic regression မော်ဒယ်သုံးခုကို တပ်ဆင်ပြီး မော်ဒယ်တစ်ခုစီအတွက် အောက်ပါ ROC မျဉ်းကွေးများကို ကြံစည်သည်ဆိုပါစို့။

မော်ဒယ်တစ်ခုစီအတွက် AUC ကို အောက်ပါအတိုင်း တွက်ချက်မည်ဆိုပါစို့။
- မော်ဒယ် A: AUC = 0.923
- မော်ဒယ် B: AUC = 0.794
- မော်ဒယ် C: AUC = 0.588
မော်ဒယ် A တွင် အမြင့်ဆုံး AUC ရှိပြီး ၎င်းသည် မျဉ်းကွေးအောက်တွင် အမြင့်ဆုံး ဧရိယာရှိကြောင်း ညွှန်ပြပြီး လေ့လာမှုများကို အမျိုးအစားများ မှန်ကန်စွာ ပိုင်းခြားရန် အကောင်းဆုံး မော်ဒယ်ဖြစ်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် မတူညီသော စာရင်းအင်းဆော့ဖ်ဝဲကို အသုံးပြု၍ ROC မျဉ်းကွေးများကို ဖန်တီးနည်းကို ရှင်းပြသည်-