Dplyr- ဒေတာအကျဉ်းချုပ်နည်း၊ ကော်လံအားလုံးကို သိမ်းထားပါ။


dplyr တွင် summarise() လုပ်ဆောင်ချက်ကို အသုံးပြုသောအခါ၊ summarise() သို့မဟုတ် group_by() လုပ်ဆောင်ချက်များတွင် မပါဝင်သည့် ကိန်းရှင်များကို အလိုအလျောက် ဖယ်ရှားပါမည်။

သို့ရာတွင်၊ သင်သည် ဒေတာဘောင်အတွင်း ကော်လံအားလုံးကို ထိန်းသိမ်းထားစဉ် ဒေတာကို အကျဉ်းချုပ်ရန် mutate() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- ဒေတာကို အကျဉ်းချုပ်သော်လည်း dplyr သုံးပြီး ကော်လံအားလုံးကို သိမ်းထားပါ။

ကျွန်ုပ်တို့တွင် အမျိုးမျိုးသော ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်ပါရှိသော အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 3 ),
                 points=c(4, 9, 8, 12, 15, 14, 29, 30, 22),
                 assists=c(3, 3, 2, 5, 8, 10, 4, 5, 12))

#view data frame
df

  team points assists
1 to 4 3
2 to 9 3
3 to 8 2
4 B 12 5
5 B 15 8
6 B 14 10
7 C 29 4
8 C 30 5
9 C 22 12

အသင်း တစ်သင်းလျှင် ရမှတ်ပျမ်းမျှ ရမှတ်များကို အကျဉ်းချုပ်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 library (dplyr)

#summarize mean points values by team
df %>%
  group_by(team) %>%
  summarize(mean_pts = mean(points))

# A tibble: 3 x 2
  team mean_pts
      
1 to 7  
2 B 13.7
3 C 27

Mean_pts ဟုခေါ်သော ကော်လံသည် အသင်းတစ်ခုစီမှ ရရှိသော ပျမ်းမျှရမှတ်များကို ပြသသည်။

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • အသင်း A မှ ကစားသမားများ၏ ပျမ်းမျှရမှတ်မှာ 7 မှတ် ဖြစ်သည်။
  • အသင်း B မှ ကစားသမားများ၏ ပျမ်းမျှရမှတ်မှာ 13.7 ဖြစ်သည်။
  • အသင်း C မှ ကစားသမားများ၏ ပျမ်းမျှရမှတ်မှာ 27 မှတ် ဖြစ်သည်။

သို့သော်၊ ကျွန်ုပ်တို့သည် အခြားကော်လံအားလုံးကို မူရင်းဒေတာဘောင်မှ သိမ်းထားလိုသည်ဆိုကြပါစို့။

ဒါကိုလုပ်ဖို့ mutate() function နဲ့ အောက်ဖော်ပြပါ syntax ကို အသုံးပြုနိုင်ပါတယ်။

 library (dplyr)

#summarize mean points values by team and keep all columns
df %>%
  group_by(team) %>%
  mutate(mean_pts = mean(points)) %>%
  A group()

# A tibble: 9 x 4
  team points assists mean_pts
           
1 to 4 3 7  
2 to 9 3 7  
3 to 8 2 7  
4 B 12 5 13.7
5 B 15 8 13.7
6 B 14 10 13.7
7 C 29 4 27  
8 C 30 5 27  
9 C 22 12 27

mutate() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ မူရင်းဒေတာဘောင်မှ အခြားကော်လံအားလုံးကို ဆက်လက်ထိန်းသိမ်းထားစဉ်တွင် အသင်းတစ်သင်းလျှင် ရမှတ်ပျမ်းမျှရမှတ်များကို အကျဉ်းချုပ်ဖော်ပြသည့် Mean_pts ဟုခေါ်သော ကော်လံအသစ်ကို ဖန်တီးနိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

dplyr- ကော်လံတွင် စာကြောင်းတစ်ခုပါရှိလျှင် ကိန်းရှင်တစ်ခုကို မည်သို့ပြောင်းရမည်နည်း။
dplyr- mutate() ကို အသုံးပြု၍ အချက်အဆင့်များကို ပြောင်းလဲနည်း
dplyr- ကော်လံအများအပြားတွင် ထည့်သွင်းနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်