Ggplot2 ကိုအသုံးပြု၍ roc curve ကိုမည်သို့ဆွဲမည်နည်း (ဥပမာများဖြင့်)
Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model တစ်ခုနှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့အသုံးပြုသည့် ကိန်းဂဏန်းဆိုင်ရာ နည်းလမ်းတစ်ခုဖြစ်သည်။ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း အကဲဖြတ်ရန်၊ အောက်ပါ မက်ထရစ်နှစ်ခုကို ကြည့်နိုင်သည်-
- အာရုံခံစားနိုင်မှု- ရလဒ်အမှန်တကယ်အပြုသဘောဆောင်သောအခါတွင် လေ့လာမှုတစ်ခုအတွက် အပြုသဘောဆောင်သောရလဒ်ကို မော်ဒယ်က ခန့်မှန်းပေးသည့်ဖြစ်နိုင်ခြေ။
- တိကျမှု- ရလဒ်အမှန်တကယ် အနုတ်လက္ခဏာဖြစ်သောအခါ စောင့်ကြည့်မှုတစ်ခုအတွက် အနုတ်ရလဒ်ကို မော်ဒယ်က ခန့်မှန်းသည့် ဖြစ်နိုင်ခြေ။
ဤမက်ထရစ်နှစ်ခုကို မြင်သာစေရန် ရိုးရှင်းသောနည်းလမ်းမှာ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ၏ အာရုံခံနိုင်စွမ်းနှင့် တိကျမှုကိုပြသသည့် ဂရပ်တစ်ခုဖြစ်သည့် ROC မျဉ်းကွေးကို ဖန်တီးရန်ဖြစ်သည်။
ဤသင်ခန်းစာသည် ggplot2 အမြင်အာရုံပုံဖော်ခြင်းပက်ကေ့ဂျ်ကို အသုံးပြု၍ R တွင် ROC မျဉ်းကွေးတစ်ခုကို ဖန်တီးပြီး အဓိပ္ပာယ်ပြန်ဆိုနည်းကို ရှင်းပြထားသည်။
ဥပမာ- ggplot2 ကို အသုံးပြု၍ ROC မျဉ်းကွေး
ကျွန်ုပ်တို့သည် R တွင် အောက်ပါ logistic regression model နှင့် ကိုက်ညီသည်ဆိုပါစို့။
#load Default dataset from ISLR book data <- ISLR::Default #divide dataset into training and test set set.seed(1) sample <- sample(c( TRUE , FALSE ), nrow (data), replace = TRUE , prob =c(0.7,0.3)) train <- data[sample, ] test <- data[!sample, ] #fit logistic regression model to training set model <- glm(default~student+balance+income, family=" binomial ", data=train) #use model to make predictions on test set predicted <- predict(model, test, type=" response ")
စမ်းသပ်မှုအစုံရှိ logistic regression model ၏စွမ်းဆောင်ရည်ကိုမြင်ယောင်ရန်၊ pPROC ပက်ကေ့ဂျ် မှ ggroc() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ROC ကွက်ကွက်တစ်ခုကို ဖန်တီးနိုင်သည်-
#load necessary packages library (ggplot2) library (pROC) #define object to plot rocobj <- roc(test$default, predicted) #create ROC plot ggroc(rocobj)
y-axis သည် model ၏ sensitivity (စစ်မှန်သော positive rate) ကိုပြသပြီး x-axis သည် model ၏ specificity (the true negative rate) ကိုပြသသည်။
ကျွန်ုပ်တို့သည် ဇာတ်ကွက်တွင် စတိုင်လ်ထည့်သွင်းနိုင်ပြီး ကွက်ကွက်၏ AUC (မျဉ်းကွေးအောက်ရှိ ဧရိယာ) ပါရှိသော ခေါင်းစဉ်ကိုလည်း ပေးဆောင်နိုင်သည်ကို သတိပြုပါ-
#load necessary packages library (ggplot2) library (pROC) #define object to plot and calculate AUC rocobj <- roc(test$default, predicted) auc <- round (auc(test$default, predicted), 4 ) #create ROC plot ggroc(rocobj, color = ' steelblue ', size = 2 ) + ggtitle( paste0 (' ROC Curve ', ' (AUC = ', auc, ' ) '))
ဇာတ်လမ်း၏ အပြင်အဆင်ကိုလည်း သင်မွမ်းမံနိုင်သည်ကို သတိပြုပါ-
#create ROC plot with minimal theme ggroc(rocobj, color = ' steelblue ', size = 2 ) + ggtitle( paste0 (' ROC Curve ', ' (AUC = ', auc, ' ) ')) + theme_minimal()
အကောင်းဆုံး ggplot2 ခေါင်းစဉ်များအတွက် လမ်းညွှန်ချက်အတွက် ဤဆောင်းပါးကို ကိုးကားပါ။