R တွင် matthews ဆက်စပ်ကိန်းကို တွက်နည်း


Matthews Correlation Coefficient (MCC) သည် အမျိုးအစားခွဲခြင်းပုံစံ တစ်ခု၏ စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် မက်ထရစ်တစ်ခုဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

MCC = (TP*TN – FP*FN) / √ (TP+FP)(TP+FN)(TN+FP)(TN+FN)

ရွှေ-

  • TP : စစ်မှန်သော အပြုသဘောဆောင်သည့် အရေအတွက်
  • TN : အနုတ်အမှန် အရေအတွက်
  • FP : မှားယွင်းသော အပြုသဘောဆောင်သည့် အရေအတွက်
  • FN : မှားယွင်းသော အနုတ်လက္ခဏာ အရေအတွက်

အတန်းနှစ်ခုသည် ဟန်ချက်မညီသောအခါတွင် ဤမက်ထရစ်သည် အထူးသဖြင့် အသုံးဝင်သည်၊ ဆိုလိုသည်မှာ အတန်းတစ်ခုသည် အခြားတစ်ခုထက် များစွာပိုနေပါသည်။

MCC ၏တန်ဖိုးသည် -1 နှင့် 1 အကြားတွင် ရှိနေသည်-

  • -1 သည် ခန့်မှန်းထားသော အတန်းများနှင့် အမှန်တကယ် အတန်းများကြား သဘောထားကွဲလွဲမှုကို ညွှန်ပြသည်။
  • ဘ၀ ဟူသည် လုံးဝ ကြုံသလို မှန်းဆခြင်း ဖြစ်သည်။
  • 1 သည် ခန့်မှန်းထားသော အတန်းများနှင့် အမှန်တကယ် အတန်းများကြား ပြီးပြည့်စုံသော သဘောတူညီချက်ကို ညွှန်ပြသည်။

ဥပမာအားဖြင့်၊ အားကစားသုံးသပ်သူတစ်ဦးသည် မတူညီသောကောလိပ်ဘတ်စကက်ဘောကစားသမား 400 ကို NBA သို့ ရေးဆွဲမည်လား မခန့်မှန်းရန် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံကို အသုံးပြုသည်ဆိုပါစို့။

အောက်ဖော်ပြပါ ရှုပ်ထွေးမှု matrix သည် မော်ဒယ်မှ ပြုလုပ်သော ခန့်မှန်းချက်များကို အကျဉ်းချုပ်ဖော်ပြသည်-

မော်ဒယ်၏ MCC ကိုတွက်ချက်ရန်၊ ကျွန်ုပ်တို့သည် အောက်ပါဖော်မြူလာကို အသုံးပြုနိုင်ပါသည်။

  • MCC = (TP*TN – FP*FN) / √ (TP+FP)(TP+FN)(TN+FP)(TN+FN)
  • MCC = (15*375-5*5) / √ (15+5)(15+5)(375+5)(375+5)
  • MCC = 0.7368

Matthews ဆက်စပ်ကိန်းသည် 0.7368 ဖြစ်လာသည်။

ဤတန်ဖိုးသည် တစ်ခုနှင့်တစ်ခုအတန်ငယ်နီးစပ်နေပြီး၊ မော်ဒယ်သည် ကစားသမားများကို ရေးဆွဲမည်လား မလုပ်ဆောင်မည်ကို ကြိုတင်ခန့်မှန်းရန် သင့်လျော်သောအလုပ်တစ်ခု လုပ်ဆောင်နေကြောင်း ညွှန်ပြနေသည်။

အောက်ဖော်ပြပါ ဥပမာသည် R ရှိ mltools ပက်ကေ့ခ်ျမှ mcc() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဤသတ်သတ်မှတ်မှတ်အခြေအနေအတွက် MCC တွက်ချက်နည်းကို ပြသထားသည်။

ဥပမာ- R တွင် Matthews Correlation Coefficient ကို တွက်ချက်ခြင်း။

အောက်ပါကုဒ်သည် ခန့်မှန်းထားသော အတန်းများ၏ vector တစ်ခုနှင့် အမှန်တကယ် အတန်းများ၏ vector ကို မည်သို့ သတ်မှတ်ရမည်ကို ပြသပြီး mltools ပက်ကေ့ဂျ်မှ mcc() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Matthews ဆက်စပ်ကိန်းကို တွက်ချက်ပါ-

 library (mltools)

#define vector of actual classes
actual <- rep (c(1, 0), times =c(20, 380))

#define vector of predicted classes
preds <- rep (c(1, 0, 1, 0), times =c(15, 5, 5, 375))

#calculate Matthews correlation coefficient
mcc(preds, actual)

[1] 0.7368421

Matthews ဆက်စပ်ကိန်းသည် 0.7368 ဖြစ်သည်။

၎င်းသည် အစောပိုင်းက ကျွန်ုပ်တို့ကိုယ်တိုင်တွက်ချက်ထားသော တန်ဖိုးနှင့် ကိုက်ညီပါသည်။

ရှုပ်ထွေးမှုမက်ထရစ်အတွက် Matthews ဆက်စပ်ကိန်းကို တွက်ချက်လိုပါက confusionM အကြောင်းပြချက်ကို အောက်ပါအတိုင်း အသုံးပြုနိုင်ပါသည်။

 library (mltools)

#create confusion matrix
conf_matrix <- matrix(c(15, 5, 5, 375), nrow= 2 )

#view confusion matrix
conf_matrix

     [,1] [,2]
[1,] 15 5
[2,] 5,375

#calculate Matthews correlation coefficient for confusion matrix
mcc(confusionM = conf_matrix)

[1] 0.7368421

တဖန် Matthews ဆက်စပ်ကိန်းသည် 0.7368 ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် logistic regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း
ggplot2 ကိုသုံးပြီး ROC မျဉ်းကွေးကို ဘယ်လိုဆွဲမလဲ။
R တွင် F1 ရမှတ်ကိုဘယ်လိုတွက်မလဲ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်