Category: လမ်းညွှန်

R တွင် matthews ဆက်စပ်ကိန်းကို တွက်နည်း

Matthews Correlation Coefficient (MCC) သည် အမျိုးအစားခွဲခြင်းပုံစံ တစ်ခု၏ စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် မက်ထရစ်တစ်ခုဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။ MCC = (TP*TN – FP*FN) / √ (TP+FP)(TP+FN)(TN+FP)(TN+FN) ရွှေ- TP : စစ်မှန်သော အပြုသဘောဆောင်သည့် အရေအတွက် TN : အနုတ်အမှန် အရေအတွက် FP : မှားယွင်းသော အပြုသဘောဆောင်သည့် အရေအတွက် FN : မှားယွင်းသော အနုတ်လက္ခဏာ အရေအတွက်...

Dplyr- ကော်လံတွင် စာကြောင်းတစ်ခုပါရှိလျှင် ကိန်းရှင်တစ်ခုကို မည်သို့ပြောင်းရမည်နည်း။

ကော်လံတစ်ခုတွင် သီးခြားစာကြောင်းတစ်ခုပါရှိလျှင် ပြောင်းလွဲပြောင်းနိုင်စေရန် dplyr တွင် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။ library (dplyr) df %>% mutate_at(vars(contains(' starter ')), ~ (scale(.) %>% as. vector )) ဤ သီးခြား syntax သည် ကော်လံအမည်ရှိ စာကြောင်း “ starter” ပါရှိသော အချက်အလက်ဘောင်ရှိ ကိန်းရှင်တစ်ခုစီတွင် scale() လုပ်ဆောင်ချက်ကို သက်ရောက်ပါသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင်...

Google sheets- histogram ရှိ bins အရေအတွက်ကို ဘယ်လိုပြောင်းမလဲ။

ဟီစတိုဂရမ် တစ်ခုသည် ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများဖြန့်ဝေမှုကို လျင်မြန်စွာမြင်ယောင်နိုင်ရန် အသုံးပြုနိုင်သည့် ကွက်ကွက်တစ်ခုဖြစ်သည်။ ဤသင်ခန်းစာသည် Google Sheets တွင် ဟီစတိုဂရမ်တစ်ခုဖန်တီးပုံနှင့် အကွက်အရေအတွက်ကို ပြောင်းလဲရန် အဆင့်ဆင့်သော ဥပမာကို ပေးဆောင်ထားပြီး ဟီစတိုဂရမ်သည် သင်အလိုရှိပုံအတိုင်း အတိအကျမြင်နိုင်စေရန်။ အဆင့် 1: ဒေတာကိုဖန်တီးပါ။ ဦးစွာ အောက်ပါဒေတာအတွဲကို ဖန်တီးကြပါစို့။ အဆင့် 2: histogram ကိုဖန်တီးပါ။ ထို့နောက်၊ အပိုင်းအခြား A2:A21 ရှိ ဆဲလ်များကို မီးမောင်းထိုးပြပါ၊ ထို့နောက် Insert tab ကိုနှိပ်ပါ၊ ထို့နောက်...

Google sheets တွင် ဖြတ်တောက်ထားသော ပျမ်းမျှကို တွက်ချက်နည်း

ဖြတ်တောက်ထားသော ဆိုလိုသည်မှာ ဒေတာအစုံရှိ အသေးငယ်ဆုံးနှင့် အကြီးဆုံးတန်ဖိုးများ၏ တိကျသောရာခိုင်နှုန်းကို ဖယ်ရှားပြီးနောက် တွက်ချက်ထားသော ဒေတာအတွဲတစ်ခု၏ ပျမ်းမျှဖြစ်သည်။ ဥပမာအားဖြင့်၊ 10% ဖြတ်တောက်ထားသော ဆိုလိုချက်သည် ဒေတာအစုံ၏ အဆုံးများမှ တန်ဖိုးများ 10% ကို ဖယ်ရှားပြီးနောက် ပျမ်းမျှအား ကိုယ်စားပြုပါသည်။ Google Sheets တွင် ဖြတ်တောက်ထားသော ပျမ်းမျှကို တွက်ချက်ရန်၊ အောက်ပါ အခြေခံ syntax ကို အသုံးပြုသည့် TRIMMEAN လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်သည်- TRIMMEAN(ဒေတာ၊ အချိုးအစား မပါဝင်) ရွှေ- ဒေတာ...

Excel တွင် ဖြတ်တောက်ထားသော ဆိုလိုရင်းကို တွက်ချက်နည်း

ဖြတ်တောက်ထားသော ဆိုလိုသည်မှာ ဒေတာအစုံရှိ အသေးငယ်ဆုံးနှင့် အကြီးဆုံးတန်ဖိုးများ၏ တိကျသောရာခိုင်နှုန်းကို ဖယ်ရှားပြီးနောက် တွက်ချက်ထားသော ဒေတာအတွဲတစ်ခု၏ ပျမ်းမျှဖြစ်သည်။ ဥပမာအားဖြင့်၊ 10% ဖြတ်တောက်ထားသော ဆိုလိုသည်မှာ ဒေတာအတွဲ၏ အဆုံးများမှ ထိပ်တန်းတန်ဖိုးများ၏ 10% ကို ဖယ်ရှားပြီးနောက် ဒေတာအစုံ၏ ပျမ်းမျှအား ကိုယ်စားပြုမည်ဖြစ်သည်။ Excel တွင် ဖြတ်တောက်ထားသော ပျမ်းမျှအား တွက်ချက်ရန်၊ အောက်ပါ အခြေခံ syntax ကို အသုံးပြုသည့် TRIMMEAN လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်သည်- TRIMMEAN(အခင်းအကျင်း၊ ရာခိုင်နှုန်း) ရွှေ- array :...

R တွင် data.table နှင့် ဒေတာဘောင်- အဓိက ကွာခြားချက် သုံးခု

R ပရိုဂရမ်းမင်းဘာသာစကားတွင် data.frame သည် R ဒေတာဘေ့စ်၏ အစိတ်အပိုင်းဖြစ်သည်။ data.table ပက်ကေ့ဂျ်၏ setDF လုပ်ဆောင်ချက်ကို အသုံးပြု၍ မည်သည့် data.frame ကို data.table သို့ ပြောင်းနိုင်သည်။ data.table သည် R ရှိ data.frame တစ်ခုထက် အောက်ပါအားသာချက်များကို ပေးဆောင်သည်- 1. data.table တစ်ခုသို့ ဖိုင်တစ်ခုသို့ ဖိုင်တစ်ခုဖတ်ရန် fread function ကို data.table တစ်ခုသို့ ဖတ်ရန် read.csv ကဲ့သို့သော အခြေခံ R...

Regression coefficient အတွက် ယုံကြည်မှုကြားကာလကို r တွက်နည်း

linear regression model တွင်၊ regression coefficient သည် ခန့်မှန်းသူ variable တွင် တစ်ယူနစ်တိုးလာခြင်းနှင့်ဆက်စပ်နေသော တုံ့ပြန်မှုကိန်းရှင် ၏ ပျမ်းမျှပြောင်းလဲမှုကို ပြောပြသည်။ ဆုတ်ယုတ်မှုကိန်းဂဏန်းအတွက် ယုံကြည်မှုကြားကာလကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။ β 1 အတွက် ယုံကြည်မှုကြားကာလ : b 1 ± t 1-α/2၊ n-2 * se(b 1 ) ရွှေ-   b 1 =...

R တွင် တူညီသော စာကြောင်းတစ်ကြောင်းနှင့် ကိန်းရှင်တစ်ခုကို ပရင့်ထုတ်နည်း

မကြာခဏဆိုသလို သင်သည် R တွင် တူညီသောမျဉ်းတစ်ကြောင်းနှင့် ကိန်းရှင်တစ်ခုကို ပရင့်ထုတ်လိုပေမည်။ ကံကောင်းစွာဖြင့်၊ ၎င်းသည် print() နှင့် paste0() လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ အောက်ပါဥပမာသည် ၎င်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။ ဥပမာ- R တွင် တူညီသောမျဉ်းတစ်ကြောင်းနှင့် ကိန်းရှင်တစ်ခုကို ပရင့်ထုတ်ပါ။ အောက်ပါကုဒ်သည် R တွင် တူညီသောစာကြောင်းတစ်ခုပေါ်ရှိ စာကြောင်းတစ်ကြောင်းနှင့် ကိန်းရှင်တစ်ခုကို ပရင့်ထုတ်ပုံကို ပြသသည်- #define variable my_variable <- 540.38 #print string...

အကောင်းဆုံးအစုများကိုရှာဖွေရန် r တွင် elbow နည်းလမ်းကိုအသုံးပြုနည်း

machine learning တွင် အသုံးအများဆုံး အစုလိုက်အပြုံလိုက် အယ်လဂိုရီသမ်များထဲမှ တစ်ခုကို k-means clustering ဟုခေါ်သည်။ K ဆိုသည်မှာ အစုအဝေးတစ်ခုစီကို K အစုအဝေးတစ်ခုသို့ ဒေတာအတွဲတစ်ခုမှ စူးစမ်းလေ့လာမှုတစ်ခုစီကို ထားရှိပေးသည့် နည်းလမ်းတစ်ခုဖြစ်သည်။ အဆုံးပန်းတိုင်မှာ အစုအဝေးတစ်ခုစီရှိ ရှုမြင်သုံးသပ်ချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်တူညီပြီး ကွဲပြားသောအစုအဝေးများတွင် လေ့လာမှုများသည် တစ်ခုနှင့်တစ်ခု အလွန်ကွာခြားသော်လည်း K အစုအဝေးများ ရှိရန်ဖြစ်သည်။ k-means အစုအဝေးပြုလုပ်သောအခါ၊ ပထမအဆင့်မှာ ကျွန်ုပ်တို့လေ့လာသုံးသပ်ချက်ထည့်လိုသောအစုအဝေးအရေအတွက် K အတွက်တန်ဖိုးကိုရွေးချယ်ရန်ဖြစ်သည်။ K အတွက် တန်ဖိုးတစ်ခုကို ရွေးချယ်ရန်...

Google sheets တွင် logistic regression လုပ်ဆောင်နည်း

Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model နှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့သုံးနိုင်သော method တစ်ခုဖြစ်သည်။ အောက်ပါ အဆင့်ဆင့် ဥပမာသည် Google Sheets တွင် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။ အဆင့် 1- XLMiner Analysis ToolPak ကို ထည့်သွင်းပါ။ Google Sheets တွင် logistic regression လုပ်ဆောင်ရန်၊ အခမဲ့ XLMiner Analysis Toolpak...