Dplyr ကို အသုံးပြု၍ အတန်းတစ်ခုစီတွင် လုပ်ဆောင်ချက်တစ်ခုကို မည်သို့အသုံးပြုရမည်နည်း။


dplyr လုပ်ဆောင်ချက်များကို အသုံးပြု၍ R ရှိ ဒေတာဘောင်တစ်ခုစီ၏ အတန်းတစ်ခုစီတွင် လုပ်ဆောင်ချက်တစ်ခုကို အသုံးချရန် အောက်ပါအခြေခံ syntax ကို သင်အသုံးပြုနိုင်သည်-

 df %>%
  rowwise() %>% 
  mutate(mean_value = mean(c(col1, col2, col3), na. rm = TRUE ))

ဤဥပမာသည် ဒေတာဘောင်ရှိ အတန်းတစ်ခုစီအတွက် col1col2 နှင့် col3 တို့၏ ပျမ်းမျှတန်ဖိုးကို တွက်ချက်ပေးသည်၊ သို့သော် သင်သည် မတူညီသောမက်ထရစ်ကို တွက်ချက်လိုသည့် မည်သည့်လုပ်ဆောင်ချက်နှင့်မဆို Mean() လုပ်ဆောင်ချက်ကို အစားထိုးနိုင်ပါသည်။

အောက်ပါဥပမာများသည် မတူညီသောဂိမ်းများတွင် မတူညီသောဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များအကြောင်း အချက်အလက်ပါရှိသော အောက်ပါဒေတာဘောင်ဖြင့် ဤ syntax ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #create data frame
df <- data. frame (game1=c(22, 25, 29, 13, 22, 30),
                 game2=c(12, 10, 6, 6, 8, 11),
                 game3=c(NA, 15, 15, 18, 22, 13))

#view data frame
df

  game1 game2 game3
1 22 12 NA
2 25 10 15
3 29 6 15
4 13 6 18
5 22 8 22
6 30 11 13

ဥပမာ 1- အတန်းတစ်ခုစီရှိ သီးခြားကော်လံများ၏ ပျမ်းမျှ

အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ အတန်းတစ်ခုစီအတွက် game1 နှင့် game3 ကော်လံများ၏ ပျမ်းမျှတန်ဖိုးကို တွက်ချက်နည်းကို ပြသသည်-

 library (dplyr)

#calculate mean of game1 and game3
df %>%
  rowwise() %>% 
  mutate(mean_points = mean(c(game1, game3), na. rm = TRUE ))

# A tibble: 6 x 4
#Rowwise: 
  game1 game2 game3 mean_points
           
1 22 12 NA 22  
2 25 10 15 20  
3 29 6 15 22  
4 13 6 18 15.5
5 22 8 22 22  
6 30 11 13 21.5

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • ပထမအတန်းရှိ game1 နှင့် game3 ၏ပျမ်းမျှတန်ဖိုးသည် 22 ဖြစ်သည်။
  • ဒုတိယအတန်းရှိ game1 နှင့် game3 ၏ပျမ်းမျှတန်ဖိုးသည် 20 ဖြစ်သည်။
  • တတိယအတန်းရှိ game1 နှင့် game3 ၏ပျမ်းမျှတန်ဖိုးသည် 22 ဖြစ်သည်။

နောက် … ပြီးတော့။

ဥပမာ 2- အတန်းတစ်ခုစီရှိ သတ်မှတ်ထားသော ကော်လံများ၏ အများဆုံးအရေအတွက်

အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ အတန်းတစ်ခုစီအတွက် game2 နှင့် game3 ကော်လံများ၏ အများဆုံးတန်ဖိုးကို တွက်ချက်နည်းကို ပြသသည်-

 library (dplyr)

#calculate max of game2 and game3
df %>%
  rowwise() %>% 
  mutate(max_points = max(c(game2, game3), na. rm = TRUE ))

# A tibble: 6 x 4
#Rowwise: 
  game1 game2 game3 max_points
          
1 22 12 NA 12
2 25 10 15 15
3 29 6 15 15
4 13 6 18 18
5 22 8 22 22
6 30 11 13 13

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • ပထမတန်းရှိ game2 နှင့် game3 ၏အမြင့်ဆုံးတန်ဖိုးမှာ 12 ဖြစ်သည်။
  • ဒုတိယအတန်းရှိ game2 နှင့် game3 ၏အမြင့်ဆုံးတန်ဖိုးမှာ 15 ဖြစ်သည်။
  • တတိယအတန်းရှိ game2 နှင့် game3 ၏အမြင့်ဆုံးတန်ဖိုးသည် 15 ဖြစ်သည်။

နောက် … ပြီးတော့။

ဥပမာ 3- အတန်းတစ်ခုစီရှိ သီးခြားကော်လံများ၏ စံသွေဖည်မှု

အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ အတန်းတစ်ခုစီအတွက် game2 နှင့် game3 ကော်လံများရှိ တန်ဖိုးများ၏ စံသွေဖည်မှုကို တွက်ချက်နည်းကို ပြသသည်-

 library (dplyr)

#calculate standard deviation of game2 and game3
df %>%
  rowwise() %>% 
  mutate(sd_points = sd(c(game2, game3), na. rm = TRUE ))

# A tibble: 6 x 4
#Rowwise: 
  game1 game2 game3 sd_points
         
1 22 12 NA NA   
2 25 10 15 3.54
3 29 6 15 6.36
4 13 6 18 8.49
5 22 8 22 9.90
6 30 11 13 1.41

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • ပထမအတန်းရှိ game2 နှင့် game3 ၏ စံသွေဖည်မှုသည် NA (စံသွေဖည်တန်ဖိုးတစ်ခုတည်းမှ တွက်ချက်၍မရသောကြောင့်)။
  • ဒုတိယအတန်းရှိ game2 နှင့် game3 ၏စံသွေဖည်မှုသည် 3.54 ဖြစ်သည်။
  • ပထမအတန်း 6.36 ရှိ game2 နှင့် game3 ၏ စံသွေဖည်မှု။

နောက် … ပြီးတော့။

မှတ်ချက် – dplyr တွင် rowwise() လုပ်ဆောင်ချက်၏ စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာနိုင်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr ကိုအသုံးပြု၍ အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

dplyr ကို အသုံးပြု၍ ကွဲပြားသောတန်ဖိုးများကို ရေတွက်နည်း
dplyr ကိုသုံးပြီး ကော်လံများစွာကို ပေါင်းနည်း
dplyr ကို အသုံးပြု၍ ဒေတာဘောင်တစ်ခုတွင် တန်ဖိုးများစွာကို အစားထိုးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်