R တွင် အုပ်စုအလိုက် အနှစ်ချုပ်ကိန်းဂဏန်း တွက်ချက်နည်း


R တွင် အုပ်စုအကျဉ်းချုပ်ကိန်းဂဏန်းများကို တွက်ချက်ရန် အခြေခံနည်းလမ်းနှစ်ခုရှိသည်။

နည်းလမ်း 1- Base R မှ tapply() ကိုသုံးပါ။

 tapply(df$value_col, df$group_col, summary)

နည်းလမ်း 2- dplyr package မှ group_by() ကိုသုံးပါ။

 library (dplyr)

df %>%
  group_by (group_col) %>% 
  summarize (min = min(value_col),
            q1 = quantile(value_col, 0.25 ),
            median = median(value_col),
            mean = mean(value_col),
            q3 = quantile(value_col, 0.75 ),
            max = max(value_col))

အောက်ဖော်ပြပါ ဥပမာများသည် နည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

နည်းလမ်း 1- Base R မှ tapply() ကိုသုံးပါ။

အုပ်စုအလိုက် အကျဉ်းချုပ်စာရင်းအင်းများကို တွက်ချက်ရန် အောက်ပါကုဒ်သည် R ရှိ tapply() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(99, 68, 86, 88, 95, 74, 78, 93),
                 assists=c(22, 28, 31, 35, 34, 45, 28, 31),
                 rebounds=c(30, 28, 24, 24, 30, 36, 30, 29))

#calculate summary statistics of 'points' grouped by 'team'
tapply(df$points, df$team, summary)

$A
   Min. 1st Qu. Median Mean 3rd Qu. Max. 
  68.00 81.50 87.00 85.25 90.75 99.00 

$B
   Min. 1st Qu. Median Mean 3rd Qu. Max. 
   74.0 77.0 85.5 85.0 93.5 95.0 

နည်းလမ်း 2- dplyr package မှ group_by() ကိုသုံးပါ။

အောက်ပါကုဒ်သည် အုပ်စုအလိုက် အကျဉ်းချုပ်စာရင်းအင်းများကို တွက်ချက်ရန် dplyr package ရှိ group_by() နှင့် summary() လုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 library (dplyr)

#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(99, 68, 86, 88, 95, 74, 78, 93),
                 assists=c(22, 28, 31, 35, 34, 45, 28, 31),
                 rebounds=c(30, 28, 24, 24, 30, 36, 30, 29))

#calculate summary statistics of 'points' grouped by 'team'
df %>%
  group_by (team) %>% 
  summarize (min = min(points),
            q1 = quantile(points, 0.25 ),
            median = median(points),
            mean = mean(points),
            q3 = quantile(points, 0.75 ),
            max = max(points))

# A tibble: 2 x 7
  team min q1 median mean q3 max
         
1 A 68 81.5 87 85.2 90.8 99
2 B 74 77 85.5 85 93.5 95

နည်းလမ်းနှစ်ခုလုံးသည် အတိအကျတူညီသောရလဒ်များ ပြန်လာသည်ကို သတိပြုပါ။

dplyr ချဉ်းကပ်မှုသည် ပိုမိုကြီးမားသောဒေတာဘောင်များအတွက် ပိုမိုမြန်ဆန်နိုင်သော်လည်း နည်းလမ်းနှစ်ခုစလုံးသည် သေးငယ်သောဒေတာဘောင်များတွင် အလားတူလုပ်ဆောင်မည်ကို သတိပြုသင့်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားသော ဘုံအုပ်စုဖွဲ့လုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် အုပ်စုအလိုက် ကြိမ်နှုန်းဇယားကို ဖန်တီးနည်း
R တွင် အုပ်စုအလိုက် ပေါင်းစည်းနည်း
R တွင် အုပ်စုအလိုက် ပျမ်းမျှတွက်နည်း
R တွင် အုပ်စုအလိုက် ပေါင်းစည်းနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်