Category: လမ်းညွှန်
အချို့သောစာကြောင်းများပါရှိသော R ရှိ ဒေတာဘောင်တစ်ခုတွင် အတန်းများကို မကြာခဏ စစ်ထုတ်လိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် dplyr အထုပ်ရှိ filter() လုပ်ဆောင်ချက်နှင့် Base R ရှိ grepl() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ကို အသုံးပြု၍ ဤလုပ်ဆောင်ချက်များကို လက်တွေ့အသုံးပြုနိုင်သည့် နမူနာများစွာကို ပြသသည်- #create data frame df <- data.frame(player = c('P Guard', 'S Guard', 'S Forward',...
R တွင် လူများ မကြာခဏ ရှုပ်ထွေးစေသော လုပ်ဆောင်ချက် နှစ်ခုမှာ grep() နှင့် grepl() ဖြစ်သည်။ လုပ်ဆောင်ချက်နှစ်ခုလုံးသည် string တစ်ခုတွင် အချို့သောပုံစံရှိမရှိ သိနိုင်သော်လည်း ၎င်းတို့သည် မတူညီသောရလဒ်များကို ပြန်ပေးသည်- grepl() သည် စာကြောင်းတစ်ခုတွင် ပုံစံတစ်ခုရှိသောအခါ TRUE ပြန်ပေးသည်။ grep() သည် ပုံစံပါရှိသော string indices ၏ vector တစ်ခုကို ပြန်ပေးသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤခြားနားချက်ကို ဖော်ပြသည်။ #create a vector...
tibble သည် ဒေတာဘောင်တစ်ခု၏ ပထမ 10 လိုင်းများကိုသာပြသသည့် သန့်စင်သောပုံနှိပ်ခြင်းနည်းလမ်းပါရှိသော R ရှိ ဒေတာဘောင်တစ်ခုဖြစ်သည်။ ၎င်းသည် ကြီးမားသောဒေတာနှင့် လုပ်ဆောင်ရန် ပိုမိုလွယ်ကူစေပြီး R သည် ဒေတာဘောင်တစ်ခုအတွင်း အတန်းတိုင်းကို ပြသရန်ကြိုးစားခြင်းမှ တားဆီးပေးသည်။ ဥပမာအားဖြင့်၊ အတန်း 80 နှင့် ကော်လံ 2 ခုပါသော အောက်ပါ tibble ကို သုံးသပ်ပါ။ #load dplyr library(dplyr) #make this example reproducible set.seed(1) #create tibble...
မကြာခဏဆိုသလို R ရှိ ဒေတာဘောင်တစ်ခု၏ တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသောကော်လံများတွင် တန်ဖိုးများ၏ နှိုင်းရကြိမ်နှုန်း/အချိုးများကို တွက်ချက်လိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် dplyr ပက်ကေ့ခ်ျရှိ လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ရှိ နှိုင်းရကြိမ်နှုန်းများကို တွက်ချက်ရန် ဤလုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်- #create data frame df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B'), position =...
မကြာခဏဆိုသလို သင်သည် R ရှိ ဒေတာဘောင်တစ်ခုတွင် အုပ်စုတစ်ခုစီ၏ အမြင့်ဆုံးတန်ဖိုးကို ရှာဖွေလိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် dplyr ပက်ကေ့ခ်ျရှိ လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ကို အသုံးပြု၍ ၎င်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။ #create data frame df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B'), position = c('G', 'F', 'F',...
မကြာခဏဆိုသလို သင်သည် အချို့သောအခြေအနေများအပေါ်အခြေခံ၍ R ရှိ ဒေတာဘောင်တစ်ခုတွင် ကိန်းရှင်အသစ်တစ်ခုကို ဖန်တီးလိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် dplyr package မှ mutate() နှင့် case_when() လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ဖြင့် ဤလုပ်ဆောင်ချက်များကို အသုံးပြုခြင်း၏နမူနာများစွာကို ပြသသည်- #create data frame df <- data.frame(player = c('a', 'b', 'c', 'd', 'e'), position = c('G', 'F',...
interquartile range ကို မကြာခဏ “ IQR” ဟုခေါ်ပြီး ဒေတာအစုတစ်ခု၏ 50% အလယ်တန်းခွဲဝေမှုကို တိုင်းတာသည့်နည်းလမ်းတစ်ခုဖြစ်သည်။ ဒေတာအစုတစ်ခု၏ ပထမ quartile* (25th percentile) နှင့် တတိယ quartile (the 75th percentile) အကြား ကွာခြားချက်အဖြစ် တွက်ချက်ပါသည်။ ကံကောင်းထောက်မစွာ၊ numpy.percentile() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Python ရှိ ဒေတာအတွဲတစ်ခု၏ ကွာတားအကွာအဝေးကို တွက်ချက်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးပြုပုံ နမူနာများစွာကို ပြသထားသည်။ ဥပမာ...
မကြာခဏဆိုသလို၊ သင်သည် R တွင် ggplot2 ပက်ကေ့ဂျ်ကို အသုံးပြု၍ ကွက်ကွက်နှစ်ခုကို ဖန်တီးလိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် patchwork package ၏အကူအညီဖြင့် လုပ်ဆောင်ရန်လွယ်ကူသည်။ #install ggplot2 and patchwork packages install.packages(' ggplot2 ') install.packages(' patchwork ') #load the packages library(ggplot2) library(patchwork) ဤသင်ခန်းစာတွင် ဘေးချင်းကပ်ကွက်များကို ဖန်တီးရန် ဤပက်ကေ့ဂျ်များကို အသုံးပြုခြင်း၏ နမူနာများစွာကို ပြသထားသည်။ ဥပမာ 1- ဘေးချင်းကပ်...
ggplot2 ကို အသုံးပြု၍ ကွက်ကွက်တစ်ခုပေါ်တွင် ဝင်ရိုးကန့်သတ်ချက်များကို မကြာခဏ သတ်မှတ်လိုပေမည်။ အောက်ပါလုပ်ဆောင်ချက်များကို အသုံးပြု၍ အလွယ်တကူပြုလုပ်နိုင်သည်- xlim() : x-axis ၏ အောက်နှင့် အထက် ကန့်သတ်ချက်ကို သတ်မှတ်သည်။ ylim(): y ဝင်ရိုး၏ အောက်နှင့် အထက် ကန့်သတ်ချက်ကို သတ်မှတ်သည်။ ဤနည်းလမ်းနှစ်ခုစလုံးသည် တစ်ခါတစ်ရံတွင် မလိုလားအပ်သော အကျိုးဆက်များကို ဖြစ်ပေါ်စေနိုင်သည့် ဘောင်အပြင်ဘက်ရှိ ဒေတာများကို ဖယ်ရှားမည်ဖြစ်ကြောင်း သတိပြုပါ။ ဒေတာလေ့လာချက်များကို မဖယ်ရှားဘဲ ဝင်ရိုးနယ်နိမိတ်များကို ပြောင်းလဲရန်၊ သင်သည် coord_cartesian(): coord_cartesian()...
တစ်ခါတစ်ရံတွင် သင်သည် R ရှိ boxplots များမှ outliers များကို ဖယ်ရှားလိုပေမည်။ ဤသင်ခန်းစာတွင် base R နှင့် ggplot2 နှစ်မျိုးလုံးကို အသုံးပြု၍ ၎င်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။ Base R ရှိ ဘောက်စ်ကွက်များရှိ အစွန်းများကို ဖယ်ရှားပါ။ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။ data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25,...