Category: လမ်းညွှန်
R ရှိ ဒေတာဘောင်တစ်ခု၏ ကော်လံတစ်ခုတွင် စာကြောင်းတစ်ခုပါရှိမရှိ စစ်ဆေးရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်ပါသည်။ နည်းလမ်း 1- ကော်လံတွင် စာကြောင်းအတိအကျရှိမရှိ စစ်ဆေးပါ။ sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0 နည်းလမ်း 2- ကော်လံတွင် တစ်စိတ်တစ်ပိုင်းစာကြောင်းရှိမရှိ စစ်ဆေးပါ။ sum(str_detect(df$column_name, ' partial_string ')) > 0 နည်းလမ်း 3- ကော်လံတွင် တစ်စိတ်တစ်ပိုင်းစာကြောင်း ဖြစ်ပေါ်မှုကို ရေတွက်ပါ။ sum(str_detect(df$column_name, ' partial_string ')) ဤသင်ခန်းစာတွင်...
R ရှိ ဒေတာဘောင်တွင် အတန်းတစ်တန်းကို ရွေးချယ်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်သည်- နည်းလမ်း 1- ကော်လံအားလုံးရှိ Single Rows ကို ရွေးပါ။ library (dplyr) df %>% distinct() နည်းလမ်း 2- ကော်လံတစ်ခုပေါ်အခြေခံ၍ Single Rows ကိုရွေးချယ်ပါ။ library (dplyr) df %>% distinct(column1, . keep_all = TRUE ) နည်းလမ်း 3- ကော်လံများစွာကို အခြေခံ၍ အတန်းတစ်တန်းကို ရွေးပါ။...
တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော vector တစ်ခုစီ၏ အနေအထားတစ်ခုစီတွင် ပျောက်မသွားသော ပထမဆုံးတန်ဖိုးကို ပြန်ပေးရန် R ရှိ dplyr package မှ coalesce() လုပ်ဆောင်ချက်ကို သင်အသုံးပြုနိုင်ပါသည်။ ဤလုပ်ဆောင်ချက်ကိုအသုံးပြုရန် ဘုံနည်းလမ်းနှစ်ခုရှိသည်။ နည်းလမ်း 1- vector တွင် ပျောက်ဆုံးနေသော တန်ဖိုးများကို အစားထိုးပါ။ library (dplyr) #replace missing values with 100 coalescence(x, 100) နည်းလမ်း 2- ဒေတာဘောင်ကော်လံများတွင် ပထမမပျောက်နိုင်သောတန်ဖိုးကို ပြန်ပေးပါ။ library...
case statement သည် အခြေအနေများကို လည်ပတ်ပြီး ပထမအခြေအနေနှင့် ကိုက်ညီသောအခါ တန်ဖိုးကို ပြန်ပေးသည့် ကြေငြာချက်အမျိုးအစားတစ်ခုဖြစ်သည်။ R တွင် case statement တစ်ခုကို အကောင်အထည်ဖော်ရန် အလွယ်ဆုံးနည်းလမ်းမှာ dplyr package မှ case_when() လုပ်ဆောင်ချက်ကို အသုံးပြုရန်ဖြစ်သည်။ library (dplyr) df %>% mutate(new_column = case_when( col1 < 9 ~ ' value1 ', col1 < 12 ~...
သင်သည် dplyr ကို အသုံးပြု၍ ဒေတာဘောင်တစ်ခုအတွင်း ထပ်နေသောဒြပ်စင်များကို ရှာဖွေရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်သည်။ နည်းလမ်း 1- ပွားနေသောအတန်းအားလုံးကို ပြပါ။ library (dplyr) #display all duplicate rows df %>% group_by_all() %>% filter(n()> 1 ) %>% A group() နည်းလမ်း 2- ပွားနေသောအတန်းအားလုံးအတွက် ထပ်နေသောအရေအတွက်ကို ပြပါ။ library (dplyr) #display duplicate count for all...
Inf တန်ဖိုးများကို R တွင် NA တန်ဖိုးများဖြင့် အစားထိုးရန် အောက်ပါနည်းလမ်းများကို သင်သုံးနိုင်သည်။ နည်းလမ်း 1- Vector တွင် Inf ကို NA ဖြင့် အစားထိုးပါ။ x[is. infinite (x)] <- NA နည်းလမ်း 2- ဒေတာဘောင်၏ ကော်လံအားလုံးတွင် Inf ကို NA ဖြင့် အစားထိုးပါ။ df[sapply(df, is. infinite )] <- NA နည်းလမ်း 3- ဒေတာဘောင်၏...
dplyr တွင် အုပ်စုအလိုက် အတန်းများစုစည်းရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်သည်- နည်းလမ်း 1- အုပ်စုအလိုက် ကြီးလိုက်ကြီးလိုက် အတန်းများကို စီပါ။ library (dplyr) #arrange rows in ascending order based on col2, grouped by col1 df %>% group_by(col1) %>% arrange(col2, . by_group = TRUE ) နည်းလမ်း 2- အုပ်စုအလိုက် ကြီးစဉ်ငယ်လိုက် အတန်းများကို စီပါ။...
တိကျသောအခြေအနေတစ်ခုဖြင့် R ရှိဒေတာဘောင်ကော်လံတစ်ခုရှိ တန်ဖိုးအရေအတွက်များကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်သည်- နည်းလမ်း 1- အခြေအနေဖြင့် ကော်လံတစ်ခုတွင် တန်ဖိုးများကို ရေတွက်ပါ။ nrow(df[df$column1 == ' value1 ', ]) နည်းလမ်း 2- အခြေအနေများဖြင့် ကော်လံများစွာတွင် တန်ဖိုးများကို ရေတွက်ပါ။ nrow(df[df$column1 == ' value1 ' & df$column2 == ' value2 ', ]) အောက်ဖော်ပြပါ ဥပမာများသည် R ရှိ...
အချိန်စီးရီးခွဲခြမ်းစိတ်ဖြာမှုတွင်၊ ရွေ့လျားပျမ်းမျှသည် ယခင်ကာလများ၏ ပျမ်းမျှတန်ဖိုးကို ကိုယ်စားပြုသည်။ R တွင် rolling ပျမ်းမျှကို တွက်ချက်ရန် အလွယ်ကူဆုံးနည်းလမ်းမှာ တိရစ္ဆာန်ရုံ ပက်ကေ့ခ်ျမှ rollmean() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်- library (dplyr) library (zoo) #calculate 3-day rolling average df %>% mutate(rolling_avg = rollmean(values, k= 3 , fill=NA, align=' right ')) ဤဥပမာသည် တန်ဖိုးများ ဟု တံဆိပ်တပ်ထားသော ကော်လံအတွက်...
R ဖြင့် အုပ်စုဖွဲ့ခြင်းနှင့် ရေတွက်ခြင်းအခြေအနေလုပ်ဆောင်ရန် အောက်ပါအခြေခံအထားအသိုကိုသုံးနိုင်သည်။ library (dplyr) df %>% group_by(var1) %>% summarize(count = sum(var2 == ' val ')) ဤ သီးခြား syntax သည် var1 ပေါ်အခြေခံ၍ ဒေတာဘောင်၏ လိုင်းများကို အုပ်စုဖွဲ့ပြီး var2 “ val” နှင့် ညီမျှသည့် လိုင်းအရေအတွက်ကို ရေတွက်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို...