စာရင်းဇယားများတွင် ခန့်မှန်းမှုအမှားက ဘာလဲ? (အဓိပ္ပါယ်နှင့် ဥပမာများ)


စာရင်းဇယားများတွင်၊ ခန့်မှန်းမှုအမှားသည် အချို့သောမော်ဒယ်များဖြင့် ခန့်မှန်းထားသော တန်ဖိုးများနှင့် အမှန်တကယ်တန်ဖိုးများအကြား ခြားနားချက်ကို ရည်ညွှန်းသည်။

ခန့်မှန်းမှုအမှားကို အကြောင်းအရာနှစ်ခုတွင် မကြာခဏအသုံးပြုသည်-

1. Linear regression- စဉ်ဆက်မပြတ်တုံ့ပြန်မှုကိန်းရှင်၏တန်ဖိုးကို ခန့်မှန်းရန်အသုံးပြုသည်။

ကျွန်ုပ်တို့သည် ပုံမှန်အားဖြင့် RMSE ဟုခေါ်သော မက်ထရစ်ဖြင့် linear regression model ၏ ခန့်မှန်းအမှားကို တိုင်းတာပြီး root mean square error အတွက် အတိုကောက်ဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

RMSE = √ Σ(ŷ i – y i ) 2 / n

ရွှေ-

  • ∑ သည် “ပေါင်း” ဟူသော သင်္ကေတတစ်ခုဖြစ်သည်။
  • ŷ i သည် i th observation အတွက် ခန့်မှန်းတန်ဖိုးဖြစ်သည်။
  • y i သည် ith observation အတွက် မှတ်သားထားသောတန်ဖိုးဖြစ်သည်။
  • n သည် နမူနာအရွယ်အစားဖြစ်သည်။

2. Logistic regression- binary response variable ၏ တန်ဖိုးကို ခန့်မှန်းရန် အသုံးပြုသည်။

ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံ၏ ခန့်မှန်းမှုအမှားကို တိုင်းတာရန် ဘုံနည်းလမ်းမှာ စုစုပေါင်း အမျိုးအစားခွဲခြားမှု အမှားနှုန်းဟုခေါ်သော မက်ထရစ်ကို အသုံးပြုခြင်းဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

စုစုပေါင်း ခွဲခြားမှုနှုန်း = (မှားယွင်းသော ခန့်မှန်းချက် # ခု / စုစုပေါင်း ခန့်မှန်းချက် # ခု)

မှားယွင်းသောအမျိုးအစားခွဲခြားမှုနှုန်း၏တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်သည် တုံ့ပြန်မှုကိန်းရှင်၏ရလဒ်များကို ခန့်မှန်းနိုင်လေဖြစ်သည်။

အောက်ဖော်ပြပါနမူနာများသည် linear regression model နှင့် logistic regression model အတွက် ခန့်မှန်းချက်အမှားကို တွက်ချက်နည်းကို ပြသထားသည်။

ဥပမာ 1- linear regression တွင် ခန့်မှန်းတွက်ချက်မှုအမှား

ဘတ်စကတ်ဘောဂိမ်းတစ်ခုတွင် ကစားသမား 10 ဂိုးသွင်းမည်ကို ခန့်မှန်းရန် ဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့အသုံးပြုသည်ဆိုပါစို့။

အောက်ဖော်ပြပါဇယားသည် ကစားသမားများမှ ရရှိသည့်အမှန်တကယ်ရမှတ်များနှင့် မော်ဒယ်မှ ခန့်မှန်းထားသော အမှတ်များကို ပြသသည်-

root mean square error (RMSE) ကို အောက်ပါအတိုင်း တွက်ချက်ပါမည်။

  • RMSE = √ Σ(ŷ i – y i ) 2 / n
  • RMSE = √(((14-12) 2 +(15-15) 2 +(18-20) 2 +(19-16) 2 +(25-20) 2 +(18-19) 2 +(12- 16) 2 +(12-20) 2 +(15-16) 2 +(22-16) 2 ) / 10)
  • RMSE = 4

ပျမ်းမျှစတုရန်းအမှားသည် 4 ဖြစ်သည်။ ၎င်းသည် ခန့်မှန်းရမှတ်များနှင့် အမှန်တကယ်ရမှတ်များအကြား ပျမ်းမျှသွေဖည်မှုမှာ 4 ဖြစ်သည်ကို ပြောပြသည်။

ဆက်စပ်မှု- ကောင်းသော RMSE တန်ဖိုးကို အဘယ်အရာဟု ယူဆသနည်း။

ဥပမာ 2- ထောက်ပံ့ပို့ဆောင်မှုဆုတ်ယုတ်မှုတွင် ခန့်မှန်းတွက်ချက်မှုအမှား

ကောလိပ်ဘတ်စကက်ဘောကစားသမား 10 ဦးကို NBA သို့ ရေးဆွဲမည်လား မခန့်မှန်းရန် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့အသုံးပြုသည်ဆိုပါစို့။

အောက်ပါဇယားသည် ကစားသမားတစ်ဦးစီအတွက် ခန့်မှန်းထားသောရလဒ်နှင့် အမှန်တကယ်ရလဒ် (1 = ရေးဆွဲထားသော၊ 0 = ရေးဆွဲထားခြင်းမရှိသည်) ကိုပြသသည်-

စုစုပေါင်း မှားယွင်းသော အမျိုးအစားခွဲခြားမှုနှုန်းကို အောက်ပါအတိုင်း တွက်ချက်ပါမည်။

  • စုစုပေါင်း ခွဲခြားမှုနှုန်း = (မှားယွင်းသော ခန့်မှန်းချက် # ခု / စုစုပေါင်း ခန့်မှန်းချက် # ခု)
  • စုစုပေါင်း အမျိုးအစားခွဲခြားမှု မှားယွင်းမှုနှုန်း = 4/10
  • စုစုပေါင်း ခွဲခြားမှုနှုန်း = 40%

စုစုပေါင်း အမျိုးအစားခွဲခြားမှု မှားယွင်းမှုနှုန်းမှာ 40% ဖြစ်သည်။

ဤတန်ဖိုးသည် အလွန်မြင့်မားသောကြောင့် မော်ဒယ်သည် ကစားသမားတစ်ဦးကို ရေးဆွဲမည်ဟုတ်မဟုတ် ခန့်မှန်းခြင်းအတွက် အလွန်ကောင်းမွန်သောအလုပ်မဟုတ်ကြောင်း ညွှန်ပြနေသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ဆုတ်ယုတ်ခြင်းနည်းလမ်းအမျိုးမျိုးအတွက် နိဒါန်းတစ်ခုပေးသည်-

Simple Linear Regression နိဒါန်း
Multiple Linear Regression အကြောင်း နိဒါန်း
Logistic Regression နိဒါန်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်