Dplyr ကို အသုံးပြု၍ ဒေတာဘောင်များစွာကို ချိတ်ဆက်နည်း
မကြာခဏဆိုသလို၊ သင်သည် R တွင် ဒေတာဘောင်များစွာကို ချိတ်ဆက်ရန် စိတ်ဝင်စားနေပေမည်။ ကံကောင်းစွာပင်၊ ၎င်းသည် dplyr ပက်ကေ့ခ်ျမှ left_join() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည် ။
library(dplyr)
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာဘောင်သုံးခုရှိသည်ဆိုပါစို့။
#create data frame
df1 <- data.frame(a = c('a', 'b', 'c', 'd', 'e', 'f'),
b = c(12, 14, 14, 18, 22, 23))
df2 <- data.frame(a = c('a', 'a', 'a', 'b', 'b', 'b'),
c = c(23, 24, 33, 34, 37, 41))
df3 <- data.frame(a = c('d', 'e', 'f', 'g', 'h', 'i'),
d = c(23, 24, 33, 34, 37, 41))
ဒေတာဘောင်သုံးခုကို အတူတကွပူးပေါင်းရန်၊ တစ်ခုပြီးတစ်ခု အရစ်နှစ်ခုကို ရိုးရှင်းစွာလုပ်ဆောင်နိုင်သည်-
#join the three data frames df1 %>% left_join (df2, by='a') %>% left_join (df3, by='a') abcd 1 to 12 23 NA 2 to 12 24 NA 3 to 12 33 NA 4 b 14 34 NA 5 b 14 37 NA 6 b 14 41 NA 7 c 14 NA NA 8 d 18 NA 23 9th 22 NA 24 10 f 23 NA 33
ဤပူးပေါင်းမှု၏ရလဒ်ကိုလည်း ဒေတာဘောင်အဖြစ် သိမ်းဆည်းနိုင်သည်ကို သတိပြုပါ။
#join the three data frames and save result as new data frame named all_data all_data <- df1 %>% left_join (df2, by='a') %>% left_join (df3, by='a') #view summary of resulting data frame glimpse(all_data) Comments: 10 Variables: 4 $ a <chr> "a", "a", "a", "b", "b", "b", "c", "d", "e", "f" $b<dbl> 12, 12, 12, 14, 14, 14, 14, 18, 22, 23 $ c <dbl> 23, 24, 33, 34, 37, 41, NA, NA, NA, NA $ d <dbl> NA, NA, NA, NA, NA, NA, NA, 23, 24, 33
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် အတန်းများကို စစ်ထုတ်နည်း
R တွင် ထပ်နေသော မျဉ်းများကို ဖယ်ရှားနည်း
R ဖြင့် ဒေတာများကို အုပ်စုဖွဲ့ပြီး အကျဉ်းချုံးနည်း