Excel တွင် roc curve ဖန်တီးနည်း (အဆင့်ဆင့်)
Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model တစ်ခုနှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့အသုံးပြုသည့် ကိန်းဂဏန်းဆိုင်ရာ နည်းလမ်းတစ်ခုဖြစ်သည်။ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း အကဲဖြတ်ရန်၊ အောက်ပါ မက်ထရစ်နှစ်ခုကို ကြည့်နိုင်သည်-
- အာရုံခံစားနိုင်မှု- ရလဒ်အမှန်တကယ်အပြုသဘောဆောင်သောအခါတွင် လေ့လာမှုတစ်ခုအတွက် အပြုသဘောဆောင်သောရလဒ်ကို မော်ဒယ်က ခန့်မှန်းပေးသည့်ဖြစ်နိုင်ခြေ။ ၎င်းကို “စစ်မှန်သော အပြုသဘောနှုန်း” ဟုလည်း ခေါ်သည်။
- တိကျမှု- ရလဒ်အမှန်တကယ် အနုတ်လက္ခဏာဖြစ်သောအခါ စောင့်ကြည့်မှုတစ်ခုအတွက် အနုတ်ရလဒ်ကို မော်ဒယ်က ခန့်မှန်းသည့် ဖြစ်နိုင်ခြေ။ ၎င်းကို “စစ်မှန်သော အနုတ်လက္ခဏာနှုန်း” ဟုလည်း ခေါ်သည်။
ဤတိုင်းတာမှုနှစ်ခုကို မြင်ယောင်မြင်ယောင်ရန် နည်းလမ်းတစ်ခုမှာ “ လက်ခံသူလည်ပတ်မှုလက္ခဏာ” မျဉ်းကွေးကို ကိုယ်စားပြုသည့် ROC မျဉ်းကွေးကို ဖန်တီးရန်ဖြစ်သည်။ ၎င်းသည် ထောက်ပံ့ပို့ဆောင်မှု ဆုတ်ယုတ်မှုပုံစံ၏ အာရုံခံနိုင်စွမ်းနှင့် တိကျမှုကို ပြသသည့် ဂရပ်တစ်ခုဖြစ်သည်။
အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် Excel တွင် ROC မျဉ်းကွေးတစ်ခုကို ဖန်တီးပြီး အဓိပ္ပာယ်ပြန်ဆိုပုံတို့ကို ပြသထားသည်။
အဆင့် 1: ဒေတာကိုထည့်ပါ။
အချို့သောဒေတာအကြမ်းထည့်ခြင်းဖြင့် စတင်ကြပါစို့။
အဆင့် 2- စုဆောင်းဒေတာကို တွက်ချက်ပါ။
ထို့နောက် Pass နှင့် Fail အမျိုးအစားများအတွက် စုစည်းတန်ဖိုးများကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုကြပါစို့။
- စုစည်းမှုအောင်မြင်မှုတန်ဖိုးများ- =SUM($B$3:B3)
- စုစည်းမှုပျက်ကွက်တန်ဖိုးများ- =SUM($C$3:C3)
ထို့နောက် ကျွန်ုပ်တို့သည် ဤဖော်မြူလာများကို ကော်လံ D နှင့် ကော်လံ E ရှိ ဆဲလ်တစ်ခုစီသို့ ကူးယူပြီး ကူးထည့်ပါမည်။
အဆင့် 3- false positive rate နှင့် true positive rate ကို တွက်ချက်ပါ။
ထို့နောက်၊ မှားယွင်းသောအပြုသဘောနှုန်း (FPR)၊ မှန်ကန်သောအပြုသဘောနှုန်း (TPR) နှင့် မျဉ်းကွေးအောက်ရှိ ဧရိယာ (AUC) ကို အောက်ပါဖော်မြူလာများကို အသုံးပြု၍ တွက်ချက်ပါမည်။
- FPR- =1-D3/$D$14
- TPR- =1-E3/$E$14
- ASC- =(F3-F4)*G3
ထို့နောက် ကျွန်ုပ်တို့သည် ဤဖော်မြူလာများကို ကော်လံ F၊ G နှင့် H ရှိ ဆဲလ်တစ်ခုစီသို့ ကူးယူပြီး ကူးထည့်ပါမည်။
အဆင့် 4- ROC မျဉ်းကွေးကို ဖန်တီးပါ။
ROC မျဉ်းကွေးကို ဖန်တီးရန်၊ အပိုင်းအခြား F3:G14 တွင် တန်ဖိုးတစ်ခုစီကို မီးမောင်းထိုးပြပါမည်။
ထို့နောက်၊ ထိပ်ဖဲကြိုးတစ်လျှောက်ရှိ Insert tab ကိုနှိပ်ပြီး အောက်ပါလမ်းကြောင်းကိုဖန်တီးရန် Insert Scatter (X, Y) ကိုနှိပ်ပါ။
အဆင့် 5- AUC ကို တွက်ချက်ပါ။
မျဉ်းကွေးသည် ကွက်ကွက်၏ဘယ်ဘက်အပေါ်ထောင့်နှင့် ပိုနီးကပ်လေလေ၊ မော်ဒယ်သည် အချက်အလက်များကို အမျိုးအစားများခွဲခြားနိုင်လေလေဖြစ်သည်။
အထက်ဖော်ပြပါ ဂရပ်မှ ကျွန်ုပ်တို့မြင်နိုင်သည်အတိုင်း၊ ဤထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာများကို အမျိုးအစားများခွဲခြားခြင်းအတွက် အလွန်ကောင်းမွန်သော အလုပ်တစ်ခုဖြစ်သည်။
၎င်းကို တွက်ချက်ရန်အတွက် AUC (မျဉ်းကွေးအောက်တွင် ဧရိယာ) ကို တွက်ချက်နိုင်ပြီး ကွက်ကွက်၏ မျဉ်းကွေးအောက်တွင် မည်မျှရှိသည်ကို ပြောပြသည်။
AUC က 1 နဲ့ ပိုနီးစပ်လေ၊ model က ပိုကောင်းပါတယ်။ 0.5 နှင့် ညီမျှသော AUC ရှိသော မော်ဒယ်သည် ကျပန်း အမျိုးအစားများကို လုပ်ဆောင်သည့် မော်ဒယ်ထက် ပိုကောင်းမည်မဟုတ်ပါ။
မျဉ်းကွေး၏ AUC ကိုတွက်ချက်ရန်၊ ကျွန်ုပ်တို့သည် ကော်လံ H တွင် တန်ဖိုးအားလုံးကို ရိုးရိုးပေါင်းထည့်နိုင်သည်။
AUC သည် 0.802662 ဖြစ်လာသည်။ မော်ဒယ်သည် ဒေတာများကို “ Pass” နှင့် “ Fail” အမျိုးအစားများအဖြစ် အမျိုးအစားခွဲရာတွင် ကောင်းမွန်စွာလုပ်ဆောင်ကြောင်း ညွှန်ပြသော ဤတန်ဖိုးသည် အလွန်မြင့်မားပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် Excel တွင် အခြားဘုံကွက်ကွက်များ ဖန်တီးနည်းကို ရှင်းပြသည် ။
CDF ကို Excel တွင်ဘယ်လိုဆွဲမလဲ။
Excel တွင် Survival Curve ဖန်တီးနည်း
Excel တွင် Statistical Process Control Chart ဖန်တီးနည်း