Category: လမ်းညွှန်

Dplyr ကို အသုံးပြု၍ အချို့သော စာကြောင်းများပါရှိသော အတန်းများကို စစ်ထုတ်နည်း

အချို့သောစာကြောင်းများပါရှိသော R ရှိ ဒေတာဘောင်တစ်ခုတွင် အတန်းများကို မကြာခဏ စစ်ထုတ်လိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် dplyr အထုပ်ရှိ filter() လုပ်ဆောင်ချက်နှင့် Base R ရှိ grepl() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ကို အသုံးပြု၍ ဤလုပ်ဆောင်ချက်များကို လက်တွေ့အသုံးပြုနိုင်သည့် နမူနာများစွာကို ပြသသည်- #create data frame df <- data.frame(player = c('P Guard', 'S Guard', 'S Forward',...

R တွင် grep() နှင့် grepl() ကို နှိုင်းယှဉ်ခြင်း- ကွာခြားချက်ကား အဘယ်နည်း။

R တွင် လူများ မကြာခဏ ရှုပ်ထွေးစေသော လုပ်ဆောင်ချက် နှစ်ခုမှာ grep() နှင့် grepl() ဖြစ်သည်။ လုပ်ဆောင်ချက်နှစ်ခုလုံးသည် string တစ်ခုတွင် အချို့သောပုံစံရှိမရှိ သိနိုင်သော်လည်း ၎င်းတို့သည် မတူညီသောရလဒ်များကို ပြန်ပေးသည်- grepl() သည် စာကြောင်းတစ်ခုတွင် ပုံစံတစ်ခုရှိသောအခါ TRUE ပြန်ပေးသည်။ grep() သည် ပုံစံပါရှိသော string indices ၏ vector တစ်ခုကို ပြန်ပေးသည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤခြားနားချက်ကို ဖော်ပြသည်။ #create a vector...

Tibble ၏ စာကြောင်းအားလုံးကို r ဖြင့် မည်သို့ပုံနှိပ်ရမည်နည်း။

tibble သည် ဒေတာဘောင်တစ်ခု၏ ပထမ 10 လိုင်းများကိုသာပြသသည့် သန့်စင်သောပုံနှိပ်ခြင်းနည်းလမ်းပါရှိသော R ရှိ ဒေတာဘောင်တစ်ခုဖြစ်သည်။ ၎င်းသည် ကြီးမားသောဒေတာနှင့် လုပ်ဆောင်ရန် ပိုမိုလွယ်ကူစေပြီး R သည် ဒေတာဘောင်တစ်ခုအတွင်း အတန်းတိုင်းကို ပြသရန်ကြိုးစားခြင်းမှ တားဆီးပေးသည်။ ဥပမာအားဖြင့်၊ အတန်း 80 နှင့် ကော်လံ 2 ခုပါသော အောက်ပါ tibble ကို သုံးသပ်ပါ။ #load dplyr library(dplyr) #make this example reproducible set.seed(1) #create tibble...

Dplyr ကို အသုံးပြု၍ နှိုင်းရကြိမ်နှုန်းများကို တွက်ချက်နည်း

မကြာခဏဆိုသလို R ရှိ ဒေတာဘောင်တစ်ခု၏ တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသောကော်လံများတွင် တန်ဖိုးများ၏ နှိုင်းရကြိမ်နှုန်း/အချိုးများကို တွက်ချက်လိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် dplyr ပက်ကေ့ခ်ျရှိ လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ရှိ နှိုင်းရကြိမ်နှုန်းများကို တွက်ချက်ရန် ဤလုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်- #create data frame df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B'), position =...

R တွင် အုပ်စုတစ်ခုလျှင် အများဆုံးတန်ဖိုးကို မည်သို့ရှာရမည်နည်း။

မကြာခဏဆိုသလို သင်သည် R ရှိ ဒေတာဘောင်တစ်ခုတွင် အုပ်စုတစ်ခုစီ၏ အမြင့်ဆုံးတန်ဖိုးကို ရှာဖွေလိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် dplyr ပက်ကေ့ခ်ျရှိ လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ကို အသုံးပြု၍ ၎င်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။ #create data frame df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B'), position = c('G', 'F', 'F',...

Mutate() နှင့် case_when() ဖြင့် r တွင် variable အသစ်များကိုဖန်တီးပါ။

မကြာခဏဆိုသလို သင်သည် အချို့သောအခြေအနေများအပေါ်အခြေခံ၍ R ရှိ ဒေတာဘောင်တစ်ခုတွင် ကိန်းရှင်အသစ်တစ်ခုကို ဖန်တီးလိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် dplyr package မှ mutate() နှင့် case_when() လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ဖြင့် ဤလုပ်ဆောင်ချက်များကို အသုံးပြုခြင်း၏နမူနာများစွာကို ပြသသည်- #create data frame df <- data.frame(player = c('a', 'b', 'c', 'd', 'e'), position = c('G', 'F',...

Python ရှိ interquartile range ကို တွက်နည်း

interquartile range ကို မကြာခဏ “ IQR” ဟုခေါ်ပြီး ဒေတာအစုတစ်ခု၏ 50% အလယ်တန်းခွဲဝေမှုကို တိုင်းတာသည့်နည်းလမ်းတစ်ခုဖြစ်သည်။ ဒေတာအစုတစ်ခု၏ ပထမ quartile* (25th percentile) နှင့် တတိယ quartile (the 75th percentile) အကြား ကွာခြားချက်အဖြစ် တွက်ချက်ပါသည်။ ကံကောင်းထောက်မစွာ၊ numpy.percentile() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ Python ရှိ ဒေတာအတွဲတစ်ခု၏ ကွာတားအကွာအဝေးကို တွက်ချက်ရန် လွယ်ကူသည်။ ဤသင်ခန်းစာတွင် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးပြုပုံ နမူနာများစွာကို ပြသထားသည်။ ဥပမာ...

Ggplot2 တွင် ဘေးချင်းကပ်ကွက်များ ဖန်တီးနည်း

မကြာခဏဆိုသလို၊ သင်သည် R တွင် ggplot2 ပက်ကေ့ဂျ်ကို အသုံးပြု၍ ကွက်ကွက်နှစ်ခုကို ဖန်တီးလိုပေမည်။ ကံကောင်းထောက်မစွာ၊ ၎င်းသည် patchwork package ၏အကူအညီဖြင့် လုပ်ဆောင်ရန်လွယ်ကူသည်။ #install ggplot2 and patchwork packages install.packages(' ggplot2 ') install.packages(' patchwork ') #load the packages library(ggplot2) library(patchwork) ဤသင်ခန်းစာတွင် ဘေးချင်းကပ်ကွက်များကို ဖန်တီးရန် ဤပက်ကေ့ဂျ်များကို အသုံးပြုခြင်း၏ နမူနာများစွာကို ပြသထားသည်။ ဥပမာ 1- ဘေးချင်းကပ်...

Ggplot2 တွင် ဝင်ရိုးကန့်သတ်ချက်များကို မည်သို့သတ်မှတ်မည်နည်း။

ggplot2 ကို အသုံးပြု၍ ကွက်ကွက်တစ်ခုပေါ်တွင် ဝင်ရိုးကန့်သတ်ချက်များကို မကြာခဏ သတ်မှတ်လိုပေမည်။ အောက်ပါလုပ်ဆောင်ချက်များကို အသုံးပြု၍ အလွယ်တကူပြုလုပ်နိုင်သည်- xlim() : x-axis ၏ အောက်နှင့် အထက် ကန့်သတ်ချက်ကို သတ်မှတ်သည်။ ylim(): y ဝင်ရိုး၏ အောက်နှင့် အထက် ကန့်သတ်ချက်ကို သတ်မှတ်သည်။ ဤနည်းလမ်းနှစ်ခုစလုံးသည် တစ်ခါတစ်ရံတွင် မလိုလားအပ်သော အကျိုးဆက်များကို ဖြစ်ပေါ်စေနိုင်သည့် ဘောင်အပြင်ဘက်ရှိ ဒေတာများကို ဖယ်ရှားမည်ဖြစ်ကြောင်း သတိပြုပါ။ ဒေတာလေ့လာချက်များကို မဖယ်ရှားဘဲ ဝင်ရိုးနယ်နိမိတ်များကို ပြောင်းလဲရန်၊ သင်သည် coord_cartesian(): coord_cartesian()...

R ရှိ boxplots တွင် outliers များကိုမည်သို့ဖယ်ရှားနည်း

တစ်ခါတစ်ရံတွင် သင်သည် R ရှိ boxplots များမှ outliers များကို ဖယ်ရှားလိုပေမည်။ ဤသင်ခန်းစာတွင် base R နှင့် ggplot2 နှစ်မျိုးလုံးကို အသုံးပြု၍ ၎င်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။ Base R ရှိ ဘောက်စ်ကွက်များရှိ အစွန်းများကို ဖယ်ရှားပါ။ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။ data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25,...