R ဖြင့် f1 ရမှတ်ကို တွက်နည်း (ဥပမာနှင့်အတူ)


စက်သင်ယူမှုတွင် အမျိုးအစားခွဲခြင်းပုံစံများကို အသုံးပြုသည့်အခါ၊ မော်ဒယ်အရည်အသွေးကို အကဲဖြတ်ရန် ကျွန်ုပ်တို့အသုံးပြုလေ့ရှိသည့် မက်ထရစ်မှာ F1 ရမှတ် ဖြစ်သည်။

ဤမက်ထရစ်ကို အောက်ပါအတိုင်း တွက်ချက်သည်-

F1 ရမှတ် = 2 * (တိကျမှု * ပြန်လည်ခေါ်ယူခြင်း) / (တိကျမှု + ပြန်လည်ခေါ်ယူခြင်း)

ရွှေ-

  • တိကျမှု – စုစုပေါင်း အပြုသဘောဆောင်သော ခန့်မှန်းချက်များနှင့် ဆက်စပ်သော အပြုသဘောဆောင်သော ခန့်မှန်းချက်များကို မှန်ကန်စွာ ပြင်ပါ။
  • သတိပေးချက် – စုစုပေါင်းအမှန်တကယ် အပြုသဘောဆောင်သည့် အပြုသဘောဆောင်သော ခန့်မှန်းချက်များကို ပြုပြင်ခြင်း။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် မတူညီသောကောလိပ်ဘတ်စကက်ဘောကစားသမား 400 ကို NBA သို့ရေးဆွဲမည်လား မခန့်မှန်းရန် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံကို အသုံးပြုသည်ဆိုပါစို့။

အောက်ဖော်ပြပါ ရှုပ်ထွေးမှု matrix သည် မော်ဒယ်မှ ပြုလုပ်သော ခန့်မှန်းချက်များကို အကျဉ်းချုပ်ဖော်ပြသည်-

ဤသည်မှာ မော်ဒယ်၏ F1 ရမှတ်ကို တွက်ချက်နည်းဖြစ်သည်။

တိကျမှု = True Positive / (True Positive + False Positive) = 120/ (120+70) = 0.63157

Recall = True Positive / (True Positive + False Negative) = 120 / (120+40) = 0.75

F1 ရမှတ် = 2 * (.63157 * .75) / (.63157 + .75) = . ၆၈၅၇

အောက်ပါဥပမာသည် R တွင် ဤအတိအကျမော်ဒယ်အတွက် F1 ရမှတ်ကို တွက်ချက်နည်းကို ပြသထားသည်။

ဥပမာ- R ဖြင့် F1 ရမှတ်ကို တွက်ချက်ခြင်း။

ဖော်ပြပါကုဒ်သည် ပေးထားသော logistic regression model အတွက် F1 ရမှတ် (နှင့် အခြားသော မက်ထရစ်များ) ကို တွက်ချက်ရန် R ရှိ caret package မှ confuseMatrix() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 library (caret)

#define vectors of actual values and predicted values
actual <- factor(rep(c(1, 0), times=c(160, 240)))
pred <- factor(rep(c(1, 0, 1, 0), times=c(120, 40, 70, 170)))

#create confusion matrix and calculate metrics related to confusion matrix
confusionMatrix(pred, actual, mode = " everything ", positive=" 1 ")

          Reference
Prediction 0 1
         0 170 40
         1 70 120
                                          
               Accuracy: 0.725           
                 95% CI: (0.6784, 0.7682)
    No Information Rate: 0.6             
    P-Value [Acc > NIR]: 1.176e-07       
                                          
                  Kappa: 0.4444          
                                          
 Mcnemar's Test P-Value: 0.005692        
                                          
            Sensitivity: 0.7500          
            Specificity: 0.7083          
         Pos Pred Value: 0.6316          
         Neg Pred Value: 0.8095          
              Accuracy: 0.6316          
                 Recall: 0.7500          
                     F1: 0.6857          
             Prevalence: 0.4000          
         Detection Rate: 0.3000          
   Detection Prevalence: 0.4750          
      Balanced Accuracy: 0.7292          
                                          
       'Positive' Class: 1

F1 ရမှတ်သည် 0.6857 ဖြစ်သည် ။ ၎င်းသည် အစောပိုင်းတွင် ကျွန်ုပ်တို့ကိုယ်တိုင်တွက်ချက်ထားသော တန်ဖိုးနှင့် ကိုက်ညီပါသည်။

မှတ်ချက် – F1 ရမှတ်ကို အထွက်တွင် ပြသနိုင်ရန် mode=” everything” ကို သတ်မှတ်ရန် လိုအပ်ပါသည်။

မော်ဒယ်များစွာကို နှိုင်းယှဉ်ရန် F1 ရမှတ်ကို အသုံးပြုပါက၊ အမြင့်ဆုံး F1 ရမှတ်ရှိသော မော်ဒယ်သည် လေ့လာတွေ့ရှိချက်များကို အတန်းများအဖြစ် အမျိုးအစားခွဲရန် အကောင်းဆုံး မော်ဒယ်ကို ကိုယ်စားပြုသည်။

ဥပမာအားဖြင့်၊ သင်သည် အခြားသော ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို ဒေတာနှင့် အံဝင်ခွင်ကျရှိပြီး ၎င်းမော်ဒယ်တွင် F1 ရမှတ် 0.85 ရှိပါက၊ ၎င်းမော်ဒယ်သည် F1 ရမှတ် ပိုမြင့်သောကြောင့် ၎င်းကို ပိုကောင်းသည်ဟု ယူဆပါမည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် logistic regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း
F1 ရမှတ်နှင့် တိကျမှု- မည်သည့်အရာကို အသုံးပြုသင့်သနည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်