Dplyr ကို အသုံးပြု၍ r တွင် အကျဉ်းချုပ် ကိန်းဂဏန်းများ တွက်ချက်နည်း
dplyr ပက်ကေ့ဂျ်ရှိ လုပ်ဆောင်ချက်များကို အသုံးပြု၍ R ရှိ ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်များအားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-
library (dplyr) library (tidyr) df %>% summarise(across(where(is. numeric ), .fns = list(min = min, median = median, mean = mean, stdev = sd, q25 = ~quantile(., 0.25 ), q75 = ~quantile(., 0.75 ), max = max))) %>% pivot_longer(everything(), names_sep=' _ ', names_to=c(' variable ', ' .value '))
summarise() function သည် dplyr package မှ ဆင်းသက်လာပြီး variable များအတွက် အကျဉ်းချုပ်စာရင်းအင်းများကို တွက်ချက်ရန် အသုံးပြုပါသည်။
pivot_longer() လုပ်ဆောင်ချက်သည် Tidyr ပက်ကေ့ခ်ျမှ ဆင်းသက်လာပြီး ဖတ်ရှုရလွယ်ကူစေရန် အထွက်ကို ဖော်မတ်လုပ်ရန် အသုံးပြုပါသည်။
ဤ သီးခြား syntax သည် ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင် တစ်ခုစီအတွက် အောက်ပါ အကျဉ်းချုပ် ကိန်းဂဏန်းများကို တွက်ချက်သည်-
- အနိမ့်ဆုံးတန်ဖိုး
- ပျမ်းမျှတန်ဖိုး
- ပျမ်းမျှတန်ဖိုး
- စံသွေဖည်
- ၂၅ ရာခိုင်နှုန်း
- 75th ရာခိုင်နှုန်း
- အများဆုံးတန်ဖိုး
အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ- dplyr ကို အသုံးပြု၍ R တွင် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။
R တွင် ဘတ်စကက်ဘောကစားသမားများအကြောင်း အချက်အလက်များစွာပါရှိသော အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'), points=c(12, 15, 19, 14, 24, 25, 39, 34), assists=c(6, 8, 8, 9, 12, 6, 8, 10), rebounds=c(9, 9, 8, 10, 8, 4, 3, 3)) #view data frame df team points assists rebounds 1 to 12 6 9 2 A 15 8 9 3 A 19 8 8 4 A 14 9 10 5 B 24 12 8 6 B 25 6 4 7 B 39 8 3 8 B 34 10 3
ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်တစ်ခုစီအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။
library (dplyr) library (tidyr) #calculate summary statistics for each numeric variable in data frame df %>% summarise(across(where(is. numeric ), .fns = list(min = min, median = median, mean = mean, stdev = sd, q25 = ~quantile(., 0.25 ), q75 = ~quantile(., 0.75 ), max = max))) %>% pivot_longer(everything(), names_sep=' _ ', names_to=c(' variable ', ' .value ')) # A tibble: 3 x 8 variable min median mean stdev q25 q75 max 1 points 12 21.5 22.8 9.74 14.8 27.2 39 2 assists 6 8 8.38 2.00 7.5 9.25 12 3 rebounds 3 8 6.75 2.92 3.75 9 10
ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-
- အမှတ်များ ကော်လံရှိ အနိမ့်ဆုံးတန်ဖိုးမှာ 12 ဖြစ်သည်။
- အမှတ်များကော်လံရှိ ပျမ်းမျှတန်ဖိုးသည် 21.5 ဖြစ်သည်။
- အမှတ်များ ကော်လံရှိ ပျမ်းမျှတန်ဖိုးသည် 22.8 ဖြစ်သည်။
နောက် … ပြီးတော့။
မှတ်ချက် – ဤဥပမာတွင်၊ ကျွန်ုပ်တို့သည် dplyr cross() လုပ်ဆောင်ချက်ကို အသုံးပြုခဲ့သည်။ ဤလုပ်ဆောင်ချက်အတွက် စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာဖွေနိုင်ပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr ကို အသုံးပြု၍ အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
ဒေတာကို အကျဉ်းချုပ်နည်း၊ dplyr သုံးပြီး ကော်လံအားလုံးကို သိမ်းထားပါ။
dplyr ကို အသုံးပြု၍ ကော်လံအများအပြားကို အကျဉ်းချုပ်နည်း
dplyr ကို အသုံးပြု၍ စံသွေဖည်တွက်ချက်နည်း