Dplyr ကို အသုံးပြု၍ r တွင် အကျဉ်းချုပ် ကိန်းဂဏန်းများ တွက်ချက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 12, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

dplyr ပက်ကေ့ဂျ်ရှိ လုပ်ဆောင်ချက်များကို အသုံးပြု၍ R ရှိ ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်များအားလုံးအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-

 library (dplyr)
library (tidyr)

df %>% summarise(across(where(is. numeric ), .fns = 
                     list(min = min,
                          median = median,
                          mean = mean,
                          stdev = sd,
                          q25 = ~quantile(., 0.25 ),
                          q75 = ~quantile(., 0.75 ),
                          max = max))) %>%
  pivot_longer(everything(), names_sep=' _ ', names_to=c(' variable ', ' .value '))

summarise() function သည် dplyr package မှ ဆင်းသက်လာပြီး variable များအတွက် အကျဉ်းချုပ်စာရင်းအင်းများကို တွက်ချက်ရန် အသုံးပြုပါသည်။

pivot_longer() လုပ်ဆောင်ချက်သည် Tidyr ပက်ကေ့ခ်ျမှ ဆင်းသက်လာပြီး ဖတ်ရှုရလွယ်ကူစေရန် အထွက်ကို ဖော်မတ်လုပ်ရန် အသုံးပြုပါသည်။

ဤ သီးခြား syntax သည် ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင် တစ်ခုစီအတွက် အောက်ပါ အကျဉ်းချုပ် ကိန်းဂဏန်းများကို တွက်ချက်သည်-

အနိမ့်ဆုံးတန်ဖိုး
ပျမ်းမျှတန်ဖိုး
ပျမ်းမျှတန်ဖိုး
စံသွေဖည်
၂၅ ရာခိုင်နှုန်း
75th ရာခိုင်နှုန်း
အများဆုံးတန်ဖိုး

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- dplyr ကို အသုံးပြု၍ R တွင် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

R တွင် ဘတ်စကက်ဘောကစားသမားများအကြောင်း အချက်အလက်များစွာပါရှိသော အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, 15, 19, 14, 24, 25, 39, 34),
                 assists=c(6, 8, 8, 9, 12, 6, 8, 10),
                 rebounds=c(9, 9, 8, 10, 8, 4, 3, 3))

#view data frame
df

  team points assists rebounds
1 to 12 6 9
2 A 15 8 9
3 A 19 8 8
4 A 14 9 10
5 B 24 12 8
6 B 25 6 4
7 B 39 8 3
8 B 34 10 3

ဒေတာဘောင်ရှိ ကိန်းဂဏာန်းကိန်းရှင်တစ်ခုစီအတွက် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 library (dplyr)
library (tidyr)

#calculate summary statistics for each numeric variable in data frame
df %>% summarise(across(where(is. numeric ), .fns = 
                     list(min = min,
                          median = median,
                          mean = mean,
                          stdev = sd,
                          q25 = ~quantile(., 0.25 ),
                          q75 = ~quantile(., 0.75 ),
                          max = max))) %>%
  pivot_longer(everything(), names_sep=' _ ', names_to=c(' variable ', ' .value '))

# A tibble: 3 x 8
  variable min median mean stdev q25 q75 max
             
1 points 12 21.5 22.8 9.74 14.8 27.2 39
2 assists 6 8 8.38 2.00 7.5 9.25 12
3 rebounds 3 8 6.75 2.92 3.75 9 10

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

အမှတ်များ ကော်လံရှိ အနိမ့်ဆုံးတန်ဖိုးမှာ 12 ဖြစ်သည်။
အမှတ်များကော်လံရှိ ပျမ်းမျှတန်ဖိုးသည် 21.5 ဖြစ်သည်။
အမှတ်များ ကော်လံရှိ ပျမ်းမျှတန်ဖိုးသည် 22.8 ဖြစ်သည်။

နောက် … ပြီးတော့။

မှတ်ချက် – ဤဥပမာတွင်၊ ကျွန်ုပ်တို့သည် dplyr cross() လုပ်ဆောင်ချက်ကို အသုံးပြုခဲ့သည်။ ဤလုပ်ဆောင်ချက်အတွက် စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာဖွေနိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr ကို အသုံးပြု၍ အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

ဒေတာကို အကျဉ်းချုပ်နည်း၊ dplyr သုံးပြီး ကော်လံအားလုံးကို သိမ်းထားပါ။
dplyr ကို အသုံးပြု၍ ကော်လံအများအပြားကို အကျဉ်းချုပ်နည်း
dplyr ကို အသုံးပြု၍ စံသွေဖည်တွက်ချက်နည်း

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

ဥပမာ- dplyr ကို အသုံးပြု၍ R တွင် အကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ပါ။

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။