R ဖြင့် f1 ရမှတ်ကို တွက်နည်း (ဥပမာနှင့်အတူ)
စက်သင်ယူမှုတွင် အမျိုးအစားခွဲခြင်းပုံစံများကို အသုံးပြုသည့်အခါ၊ မော်ဒယ်အရည်အသွေးကို အကဲဖြတ်ရန် ကျွန်ုပ်တို့အသုံးပြုလေ့ရှိသည့် မက်ထရစ်မှာ F1 ရမှတ် ဖြစ်သည်။
ဤမက်ထရစ်ကို အောက်ပါအတိုင်း တွက်ချက်သည်-
F1 ရမှတ် = 2 * (တိကျမှု * ပြန်လည်ခေါ်ယူခြင်း) / (တိကျမှု + ပြန်လည်ခေါ်ယူခြင်း)
ရွှေ-
- တိကျမှု – စုစုပေါင်း အပြုသဘောဆောင်သော ခန့်မှန်းချက်များနှင့် ဆက်စပ်သော အပြုသဘောဆောင်သော ခန့်မှန်းချက်များကို မှန်ကန်စွာ ပြင်ပါ။
- သတိပေးချက် – စုစုပေါင်းအမှန်တကယ် အပြုသဘောဆောင်သည့် အပြုသဘောဆောင်သော ခန့်မှန်းချက်များကို ပြုပြင်ခြင်း။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် မတူညီသောကောလိပ်ဘတ်စကက်ဘောကစားသမား 400 ကို NBA သို့ရေးဆွဲမည်လား မခန့်မှန်းရန် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံကို အသုံးပြုသည်ဆိုပါစို့။
အောက်ဖော်ပြပါ ရှုပ်ထွေးမှု matrix သည် မော်ဒယ်မှ ပြုလုပ်သော ခန့်မှန်းချက်များကို အကျဉ်းချုပ်ဖော်ပြသည်-
ဤသည်မှာ မော်ဒယ်၏ F1 ရမှတ်ကို တွက်ချက်နည်းဖြစ်သည်။
တိကျမှု = True Positive / (True Positive + False Positive) = 120/ (120+70) = 0.63157
Recall = True Positive / (True Positive + False Negative) = 120 / (120+40) = 0.75
F1 ရမှတ် = 2 * (.63157 * .75) / (.63157 + .75) = . ၆၈၅၇
အောက်ပါဥပမာသည် R တွင် ဤအတိအကျမော်ဒယ်အတွက် F1 ရမှတ်ကို တွက်ချက်နည်းကို ပြသထားသည်။
ဥပမာ- R ဖြင့် F1 ရမှတ်ကို တွက်ချက်ခြင်း။
ဖော်ပြပါကုဒ်သည် ပေးထားသော logistic regression model အတွက် F1 ရမှတ် (နှင့် အခြားသော မက်ထရစ်များ) ကို တွက်ချက်ရန် R ရှိ caret package မှ confuseMatrix() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
library (caret) #define vectors of actual values and predicted values actual <- factor(rep(c(1, 0), times=c(160, 240))) pred <- factor(rep(c(1, 0, 1, 0), times=c(120, 40, 70, 170))) #create confusion matrix and calculate metrics related to confusion matrix confusionMatrix(pred, actual, mode = " everything ", positive=" 1 ") Reference Prediction 0 1 0 170 40 1 70 120 Accuracy: 0.725 95% CI: (0.6784, 0.7682) No Information Rate: 0.6 P-Value [Acc > NIR]: 1.176e-07 Kappa: 0.4444 Mcnemar's Test P-Value: 0.005692 Sensitivity: 0.7500 Specificity: 0.7083 Pos Pred Value: 0.6316 Neg Pred Value: 0.8095 Accuracy: 0.6316 Recall: 0.7500 F1: 0.6857 Prevalence: 0.4000 Detection Rate: 0.3000 Detection Prevalence: 0.4750 Balanced Accuracy: 0.7292 'Positive' Class: 1
F1 ရမှတ်သည် 0.6857 ဖြစ်သည် ။ ၎င်းသည် အစောပိုင်းတွင် ကျွန်ုပ်တို့ကိုယ်တိုင်တွက်ချက်ထားသော တန်ဖိုးနှင့် ကိုက်ညီပါသည်။
မှတ်ချက် – F1 ရမှတ်ကို အထွက်တွင် ပြသနိုင်ရန် mode=” everything” ကို သတ်မှတ်ရန် လိုအပ်ပါသည်။
မော်ဒယ်များစွာကို နှိုင်းယှဉ်ရန် F1 ရမှတ်ကို အသုံးပြုပါက၊ အမြင့်ဆုံး F1 ရမှတ်ရှိသော မော်ဒယ်သည် လေ့လာတွေ့ရှိချက်များကို အတန်းများအဖြစ် အမျိုးအစားခွဲရန် အကောင်းဆုံး မော်ဒယ်ကို ကိုယ်စားပြုသည်။
ဥပမာအားဖြင့်၊ သင်သည် အခြားသော ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံကို ဒေတာနှင့် အံဝင်ခွင်ကျရှိပြီး ၎င်းမော်ဒယ်တွင် F1 ရမှတ် 0.85 ရှိပါက၊ ၎င်းမော်ဒယ်သည် F1 ရမှတ် ပိုမြင့်သောကြောင့် ၎င်းကို ပိုကောင်းသည်ဟု ယူဆပါမည်။
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် logistic regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း
F1 ရမှတ်နှင့် တိကျမှု- မည်သည့်အရာကို အသုံးပြုသင့်သနည်း။