Dplyr ကို အသုံးပြု၍ r တွင် အကျဉ်းချုပ် ကိန်းဂဏန်းများ တွက်ချက်နည်း


dplyr ပက်ကေ့ဂျ်ရှိ လုပ်ဆောင်ချက်များကို အသုံးပြု၍ R ရှိ ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်များအားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-

 library (dplyr)
library (tidyr)

df %>% summarise(across(where(is. numeric ), .fns = 
                     list(min = min,
                          median = median,
                          mean = mean,
                          stdev = sd,
                          q25 = ~quantile(., 0.25 ),
                          q75 = ~quantile(., 0.75 ),
                          max = max))) %>%
  pivot_longer(everything(), names_sep=' _ ', names_to=c(' variable ', ' .value '))

summarise() function သည် dplyr package မှ ဆင်းသက်လာပြီး variable များအတွက် အကျဉ်းချုပ်စာရင်းအင်းများကို တွက်ချက်ရန် အသုံးပြုပါသည်။

pivot_longer() လုပ်ဆောင်ချက်သည် Tidyr ပက်ကေ့ခ်ျမှ ဆင်းသက်လာပြီး ဖတ်ရှုရလွယ်ကူစေရန် အထွက်ကို ဖော်မတ်လုပ်ရန် အသုံးပြုပါသည်။

ဤ သီးခြား syntax သည် ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင် တစ်ခုစီအတွက် အောက်ပါ အကျဉ်းချုပ် ကိန်းဂဏန်းများကို တွက်ချက်သည်-

  • အနိမ့်ဆုံးတန်ဖိုး
  • ပျမ်းမျှတန်ဖိုး
  • ပျမ်းမျှတန်ဖိုး
  • စံသွေဖည်
  • ၂၅ ရာခိုင်နှုန်း
  • 75th ရာခိုင်နှုန်း
  • အများဆုံးတန်ဖိုး

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- dplyr ကို အသုံးပြု၍ R တွင် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

R တွင် ဘတ်စကက်ဘောကစားသမားများအကြောင်း အချက်အလက်များစွာပါရှိသော အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, 15, 19, 14, 24, 25, 39, 34),
                 assists=c(6, 8, 8, 9, 12, 6, 8, 10),
                 rebounds=c(9, 9, 8, 10, 8, 4, 3, 3))

#view data frame
df

  team points assists rebounds
1 to 12 6 9
2 A 15 8 9
3 A 19 8 8
4 A 14 9 10
5 B 24 12 8
6 B 25 6 4
7 B 39 8 3
8 B 34 10 3

ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်တစ်ခုစီအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 library (dplyr)
library (tidyr)

#calculate summary statistics for each numeric variable in data frame
df %>% summarise(across(where(is. numeric ), .fns = 
                     list(min = min,
                          median = median,
                          mean = mean,
                          stdev = sd,
                          q25 = ~quantile(., 0.25 ),
                          q75 = ~quantile(., 0.75 ),
                          max = max))) %>%
  pivot_longer(everything(), names_sep=' _ ', names_to=c(' variable ', ' .value '))

# A tibble: 3 x 8
  variable min median mean stdev q25 q75 max
             
1 points 12 21.5 22.8 9.74 14.8 27.2 39
2 assists 6 8 8.38 2.00 7.5 9.25 12
3 rebounds 3 8 6.75 2.92 3.75 9 10

  ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • အမှတ်များ ကော်လံရှိ အနိမ့်ဆုံးတန်ဖိုးမှာ 12 ဖြစ်သည်။
  • အမှတ်များကော်လံရှိ ပျမ်းမျှတန်ဖိုးသည် 21.5 ဖြစ်သည်။
  • အမှတ်များ ကော်လံရှိ ပျမ်းမျှတန်ဖိုးသည် 22.8 ဖြစ်သည်။

နောက် … ပြီးတော့။

မှတ်ချက် – ဤဥပမာတွင်၊ ကျွန်ုပ်တို့သည် dplyr cross() လုပ်ဆောင်ချက်ကို အသုံးပြုခဲ့သည်။ ဤလုပ်ဆောင်ချက်အတွက် စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာဖွေနိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr ကို အသုံးပြု၍ အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

ဒေတာကို အကျဉ်းချုပ်နည်း၊ dplyr သုံးပြီး ကော်လံအားလုံးကို သိမ်းထားပါ။
dplyr ကို အသုံးပြု၍ ကော်လံအများအပြားကို အကျဉ်းချုပ်နည်း
dplyr ကို အသုံးပြု၍ စံသွေဖည်တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်