Sas တွင် roc curve ဖန်တီးနည်း


Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model နှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့သုံးနိုင်သော method တစ်ခုဖြစ်သည်။

ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း အကဲဖြတ်ရန်၊ အောက်ပါ မက်ထရစ်နှစ်ခုကို ကြည့်နိုင်သည်-

  • အာရုံခံစားနိုင်မှု- ရလဒ်အမှန်တကယ်အပြုသဘောဆောင်သောအခါတွင် လေ့လာမှုတစ်ခုအတွက် အပြုသဘောဆောင်သောရလဒ်ကို မော်ဒယ်က ခန့်မှန်းပေးသည့်ဖြစ်နိုင်ခြေ။ ၎င်းကို “စစ်မှန်သော အပြုသဘောနှုန်း” ဟုလည်း ခေါ်သည်။
  • တိကျမှု- ရလဒ်အမှန်တကယ် အနုတ်လက္ခဏာဖြစ်သောအခါ စောင့်ကြည့်မှုတစ်ခုအတွက် အနုတ်ရလဒ်ကို မော်ဒယ်က ခန့်မှန်းသည့် ဖြစ်နိုင်ခြေ။ ၎င်းကို “စစ်မှန်သော အနုတ်လက္ခဏာနှုန်း” ဟုလည်း ခေါ်သည်။

ဤတိုင်းတာမှုနှစ်ခုကို မြင်ယောင်မြင်ယောင်ရန် နည်းလမ်းတစ်ခုမှာ “ လက်ခံသူလည်ပတ်မှုလက္ခဏာ” မျဉ်းကွေးကို ကိုယ်စားပြုသည့် ROC မျဉ်းကွေးကို ဖန်တီးရန်ဖြစ်သည်။ ၎င်းသည် ထောက်ပံ့ပို့ဆောင်မှု ဆုတ်ယုတ်မှုပုံစံ၏ အာရုံခံနိုင်စွမ်းနှင့် တိကျမှုကို ပြသသည့် ဂရပ်တစ်ခုဖြစ်သည်။

အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် SAS တွင် ROC မျဉ်းကွေးတစ်ခုကို ဖန်တီးပြီး အဓိပ္ပာယ်ဖွင့်နည်းကို ပြသထားသည်။

အဆင့် 1: ဒေတာအတွဲကို ဖန်တီးပါ။

ပထမဦးစွာ၊ ကျွန်ုပ်တို့သည် ကျောင်းသား 18 ဦးအတွက် အောက်ပါကိန်းရှင်များဆိုင်ရာ အချက်အလက်များပါရှိသော ဒေတာအတွဲတစ်ခုကို ဖန်တီးပါမည်။

  • ကောလိပ်တစ်ခုခုသို့ လက်ခံခြင်း (1 = yes, 0 = no)
  • GPA (စကေး 1 မှ 4 အထိ)
  • ACT ရမှတ် (စကေး 1 မှ 36 အထိ)
 /*create dataset*/
data my_data;
    input acceptance gpa act;
    datalines ;
1 3 30
0 1 21
0 2 26
0 1 24
1 3 29
1 3 34
0 3 31
1 2 29
0 1 21
1 2 21
0 1 15
1 3 32
1 4 31
1 4 29
0 1 24
1 4 29
1 3 21
1 4 34
;
run ;

အဆင့် 2- ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို ကိုက်ညီပြီး ROC မျဉ်းကွေးကို ဖန်တီးပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် “ လက်ခံမှု” နှင့် “ gpa” နှင့် “ ပြုမူခြင်း” တို့ကို ခန့်မှန်းသည့်ကိန်းရှင်များအဖြစ် “ လက်ခံမှု” ကို အသုံးပြု၍ ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံနှင့်ကိုက်ညီရန် proc ထောက်ပံ့ပို့ဆောင်ရေးကို အသုံးပြုပါမည်။

SAS သည် တုံ့ပြန်မှုကိန်းရှင်သည် တန်ဖိုး 1 ကို ယူဆောင်မည့် ဖြစ်နိုင်ခြေကို ခန့်မှန်းနိုင် စေရန် လျှော့ချခြင်းကို ကျွန်ုပ်တို့ သတ်မှတ်ပါမည်။

မော်ဒယ်အတွက် ROC မျဉ်းကွေးကို ဖန်တီးရန် plots(only)=roc ကို အသုံးပြုပါမည်။

 /*fit logistic regression model & create ROC curve*/
proc logistic data =my_data descending plots ( only )=roc;
  model acceptance = gpa act;
run ;

SAS ရှိ ROC မျဉ်းကွေး

အဆင့် 3- ROC မျဉ်းကွေးကို ဘာသာပြန်ပါ။

ROC မျဉ်းကွေးသည် ကွက်ကွက်၏ ဘယ်ဘက်အပေါ်ထောင့်နှင့် ပိုမိုနီးကပ်လေလေ၊ မော်ဒယ်သည် ဒေတာအစုအတွင်း တုံ့ပြန်မှုတန်ဖိုးများ၏ တန်ဖိုးကို ပိုမိုကောင်းမွန်စွာ ခန့်မှန်းနိုင်လေဖြစ်သည်။

အထက်ဖော်ပြပါဂရပ်မှ၊ အပြာရောင် ROC မျဉ်းကွေးသည် ဘယ်ဘက်အပေါ်ထောင့်ကို ပွေ့ဖက်ထားတတ်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပြီး၊ ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံသည် တုံ့ပြန်မှုတန်ဖိုးများ၏တန်ဖိုးကို ခန့်မှန်းရန် ကောင်းမွန်သောအလုပ်ဖြစ်ကြောင်း ညွှန်ပြသည်။

ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာနှင့် ကိုက်ညီမှု မည်မျှရှိသည်ကို တွက်ချက်ရန်၊ မျဉ်းကွေးအောက်ရှိ AUC – ဧရိယာ – ကွက်ကွက်၏ မျဉ်းကွေးအောက်တွင် မည်မျှရှိကြောင်း ကျွန်ုပ်တို့ကို ပြောပြနိုင်သည်။

AUC က 1 နဲ့ ပိုနီးစပ်လေ၊ model က ပိုကောင်းပါတယ်။ 0.5 နှင့် ညီမျှသော AUC ရှိသော မော်ဒယ်သည် ကျပန်း အမျိုးအစားများကို လုပ်ဆောင်သည့် မော်ဒယ်ထက် ပိုကောင်းမည်မဟုတ်ပါ။

အထက်ဖော်ပြပါဇယားခေါင်းစဉ်အောက်တွင်၊ ဤမော်ဒယ်၏ AUC သည် 0.9351 ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

ဤတန်ဖိုးသည် တစ်ခုနှင့်တစ်ခုနီးစပ်သောကြောင့်၊ ၎င်းသည် မော်ဒယ်သည် တုံ့ပြန်မှုတန်ဖိုးများကို ကောင်းစွာခန့်မှန်းကြောင်း အတည်ပြုသည်။

မတူညီသော logistic regression မော်ဒယ်များ၏ အံဝင်ခွင်ကျဖြစ်မှုကို နှိုင်းယှဉ်ရန် AUC တန်ဖိုးကိုလည်း အသုံးပြုနိုင်သည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် မတူညီသော logistic regression model နှစ်ခုကို အံဝင်ခွင်ကျဖြစ်ပြီး တစ်ခုစီအတွက် AUC တန်ဖိုးများကို တွက်ချက်သည်ဆိုပါစို့။

  • မော်ဒယ် 1: 0.9351 ၏ AUC
  • မော်ဒယ် 2 ၏ AUC: 0.8140

Model 1 ၏ AUC သည် ပိုကြီးသောကြောင့် Model 1 သည် Model 2 ထက် data နှင့်ကိုက်ညီသောအလုပ်ပိုကောင်းလုပ်ဆောင်ကြောင်း ၎င်းကပြောပြသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် SAS တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

SAS တွင် ရိုးရှင်းသော linear regression လုပ်ဆောင်နည်း
SAS တွင် မျဉ်းကြောင်းပြန်ဆုတ်ခြင်းများစွာကို မည်သို့လုပ်ဆောင်ရမည်နည်း။
SAS တွင် logistic regression ကိုမည်သို့လုပ်ဆောင်ရမည်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်