Category: လမ်းညွှန်
Matthews Correlation Coefficient (MCC) သည် အမျိုးအစားခွဲခြင်းပုံစံ တစ်ခု၏ စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် မက်ထရစ်တစ်ခုဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ MCC = (TP*TN – FP*FN) / √ (TP+FP)(TP+FN)(TN+FP)(TN+FN) ရွှေ- TP : စစ်မှန်သော အပြုသဘောဆောင်သည့် အရေအတွက် TN : အနုတ်အမှန် အရေအတွက် FP : မှားယွင်းသော အပြုသဘောဆောင်သည့် အရေအတွက် FN : မှားယွင်းသော အနုတ်လက္ခဏာ အရေအတွက်...
ကော်လံတစ်ခုတွင် သီးခြားစာကြောင်းတစ်ခုပါရှိလျှင် ပြောင်းလွဲပြောင်းနိုင်စေရန် dplyr တွင် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။ library (dplyr) df %>% mutate_at(vars(contains(' starter ')), ~ (scale(.) %>% as. vector )) ဤ သီးခြား syntax သည် ကော်လံအမည်ရှိ စာကြောင်း “ starter” ပါရှိသော အချက်အလက်ဘောင်ရှိ ကိန်းရှင်တစ်ခုစီတွင် scale() လုပ်ဆောင်ချက်ကို သက်ရောက်ပါသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင်...
ဟီစတိုဂရမ် တစ်ခုသည် ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများဖြန့်ဝေမှုကို လျင်မြန်စွာမြင်ယောင်နိုင်ရန် အသုံးပြုနိုင်သည့် ကွက်ကွက်တစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာသည် Google Sheets တွင် ဟီစတိုဂရမ်တစ်ခုဖန်တီးပုံနှင့် အကွက်အရေအတွက်ကို ပြောင်းလဲရန် အဆင့်ဆင့်သော ဥပမာကို ပေးဆောင်ထားပြီး ဟီစတိုဂရမ်သည် သင်အလိုရှိပုံအတိုင်း အတိအကျမြင်နိုင်စေရန်။ အဆင့် 1: ဒေတာကိုဖန်တီးပါ။ ဦးစွာ အောက်ပါဒေတာအတွဲကို ဖန်တီးကြပါစို့။ အဆင့် 2: histogram ကိုဖန်တီးပါ။ ထို့နောက်၊ အပိုင်းအခြား A2:A21 ရှိ ဆဲလ်များကို မီးမောင်းထိုးပြပါ၊ ထို့နောက် Insert tab ကိုနှိပ်ပါ၊ ထို့နောက်...
ဖြတ်တောက်ထားသော ဆိုလိုသည်မှာ ဒေတာအစုံရှိ အသေးငယ်ဆုံးနှင့် အကြီးဆုံးတန်ဖိုးများ၏ တိကျသောရာခိုင်နှုန်းကို ဖယ်ရှားပြီးနောက် တွက်ချက်ထားသော ဒေတာအတွဲတစ်ခု၏ ပျမ်းမျှဖြစ်သည်။ ဥပမာအားဖြင့်၊ 10% ဖြတ်တောက်ထားသော ဆိုလိုချက်သည် ဒေတာအစုံ၏ အဆုံးများမှ တန်ဖိုးများ 10% ကို ဖယ်ရှားပြီးနောက် ပျမ်းမျှအား ကိုယ်စားပြုပါသည်။ Google Sheets တွင် ဖြတ်တောက်ထားသော ပျမ်းမျှကို တွက်ချက်ရန်၊ အောက်ပါ အခြေခံ syntax ကို အသုံးပြုသည့် TRIMMEAN လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်သည်- TRIMMEAN(ဒေတာ၊ အချိုးအစား မပါဝင်) ရွှေ- ဒေတာ...
ဖြတ်တောက်ထားသော ဆိုလိုသည်မှာ ဒေတာအစုံရှိ အသေးငယ်ဆုံးနှင့် အကြီးဆုံးတန်ဖိုးများ၏ တိကျသောရာခိုင်နှုန်းကို ဖယ်ရှားပြီးနောက် တွက်ချက်ထားသော ဒေတာအတွဲတစ်ခု၏ ပျမ်းမျှဖြစ်သည်။ ဥပမာအားဖြင့်၊ 10% ဖြတ်တောက်ထားသော ဆိုလိုသည်မှာ ဒေတာအတွဲ၏ အဆုံးများမှ ထိပ်တန်းတန်ဖိုးများ၏ 10% ကို ဖယ်ရှားပြီးနောက် ဒေတာအစုံ၏ ပျမ်းမျှအား ကိုယ်စားပြုမည်ဖြစ်သည်။ Excel တွင် ဖြတ်တောက်ထားသော ပျမ်းမျှအား တွက်ချက်ရန်၊ အောက်ပါ အခြေခံ syntax ကို အသုံးပြုသည့် TRIMMEAN လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်သည်- TRIMMEAN(အခင်းအကျင်း၊ ရာခိုင်နှုန်း) ရွှေ- array :...
R ပရိုဂရမ်းမင်းဘာသာစကားတွင် data.frame သည် R ဒေတာဘေ့စ်၏ အစိတ်အပိုင်းဖြစ်သည်။ data.table ပက်ကေ့ဂျ်၏ setDF လုပ်ဆောင်ချက်ကို အသုံးပြု၍ မည်သည့် data.frame ကို data.table သို့ ပြောင်းနိုင်သည်။ data.table သည် R ရှိ data.frame တစ်ခုထက် အောက်ပါအားသာချက်များကို ပေးဆောင်သည်- 1. data.table တစ်ခုသို့ ဖိုင်တစ်ခုသို့ ဖိုင်တစ်ခုဖတ်ရန် fread function ကို data.table တစ်ခုသို့ ဖတ်ရန် read.csv ကဲ့သို့သော အခြေခံ R...
linear regression model တွင်၊ regression coefficient သည် ခန့်မှန်းသူ variable တွင် တစ်ယူနစ်တိုးလာခြင်းနှင့်ဆက်စပ်နေသော တုံ့ပြန်မှုကိန်းရှင် ၏ ပျမ်းမျှပြောင်းလဲမှုကို ပြောပြသည်။ ဆုတ်ယုတ်မှုကိန်းဂဏန်းအတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။ β 1 အတွက် ယုံကြည်မှုကြားကာလ : b 1 ± t 1-α/2၊ n-2 * se(b 1 ) ရွှေ- b 1 =...
မကြာခဏဆိုသလို သင်သည် R တွင် တူညီသောမျဉ်းတစ်ကြောင်းနှင့် ကိန်းရှင်တစ်ခုကို ပရင့်ထုတ်လိုပေမည်။ ကံကောင်းစွာဖြင့်၊ ၎င်းသည် print() နှင့် paste0() လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ အောက်ပါဥပမာသည် ၎င်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။ ဥပမာ- R တွင် တူညီသောမျဉ်းတစ်ကြောင်းနှင့် ကိန်းရှင်တစ်ခုကို ပရင့်ထုတ်ပါ။ အောက်ပါကုဒ်သည် R တွင် တူညီသောစာကြောင်းတစ်ခုပေါ်ရှိ စာကြောင်းတစ်ကြောင်းနှင့် ကိန်းရှင်တစ်ခုကို ပရင့်ထုတ်ပုံကို ပြသသည်- #define variable my_variable <- 540.38 #print string...
machine learning တွင် အသုံးအများဆုံး အစုလိုက်အပြုံလိုက် အယ်လဂိုရီသမ်များထဲမှ တစ်ခုကို k-means clustering ဟုခေါ်သည်။ K ဆိုသည်မှာ အစုအဝေးတစ်ခုစီကို K အစုအဝေးတစ်ခုသို့ ဒေတာအတွဲတစ်ခုမှ စူးစမ်းလေ့လာမှုတစ်ခုစီကို ထားရှိပေးသည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ အဆုံးပန်းတိုင်မှာ အစုအဝေးတစ်ခုစီရှိ ရှုမြင်သုံးသပ်ချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်တူညီပြီး ကွဲပြားသောအစုအဝေးများတွင် လေ့လာမှုများသည် တစ်ခုနှင့်တစ်ခု အလွန်ကွာခြားသော်လည်း K အစုအဝေးများ ရှိရန်ဖြစ်သည်။ k-means အစုအဝေးပြုလုပ်သောအခါ၊ ပထမအဆင့်မှာ ကျွန်ုပ်တို့လေ့လာသုံးသပ်ချက်ထည့်လိုသောအစုအဝေးအရေအတွက် K အတွက်တန်ဖိုးကိုရွေးချယ်ရန်ဖြစ်သည်။ K အတွက် တန်ဖိုးတစ်ခုကို ရွေးချယ်ရန်...
Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model နှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့သုံးနိုင်သော method တစ်ခုဖြစ်သည်။ အောက်ပါ အဆင့်ဆင့် ဥပမာသည် Google Sheets တွင် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။ အဆင့် 1- XLMiner Analysis ToolPak ကို ထည့်သွင်းပါ။ Google Sheets တွင် logistic regression လုပ်ဆောင်ရန်၊ အခမဲ့ XLMiner Analysis Toolpak...