Cara menghitung kuantil berdasarkan kelompok di r (dengan contoh)


Dalam statistik, kuantil adalah nilai yang membagi kumpulan data rahasia menjadi kelompok yang sama.

Untuk menghitung kuantil yang dikelompokkan berdasarkan variabel tertentu di R, kita dapat menggunakan fungsi berikut dari paket dplyr di R:

 library (dplyr)

#define quantiles of interest
q = c(.25, .5, .75)

#calculate quantiles by grouping variable
df %>%
  group_by(grouping_variable) %>%
  summarize(quant25 = quantile (numeric_variable, probs = q[1]), 
            quant50 = quantile (numeric_variable, probs = q[2]),
            quant75 = quantile (numeric_variable, probs = q[3]))

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Kuantil menurut grup di R

Kode berikut menunjukkan cara menghitung kuantil jumlah kemenangan yang dikelompokkan berdasarkan tim untuk kumpulan data di R:

 library (dplyr)

#create data
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                        'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B',
                        'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C'),
                 wins=c(2, 4, 4, 5, 7, 9, 13, 13, 15, 15, 14, 13,
                        11, 9, 9, 8, 8, 16, 19, 21, 24, 20, 19, 18))

#view first six rows of data
head(df)

  team wins
1 TO 2
2 to 4
3 to 4
4 to 5
5 TO 7
6 to 9

#define quantiles of interest
q = c(.25, .5, .75)

#calculate quantiles by grouping variable
df %>%
  group_by(team) %>%
  summarize(quant25 = quantile (wins, probs = q[1]), 
            quant50 = quantile (wins, probs = q[2]),
            quant75 = quantile (wins, probs = q[3]))

  team quant25 quant50 quant75           
1 to 4 6 10  
2 B 9 12 14.2
3 C 17.5 19 20.2

Perhatikan bahwa kita juga dapat menentukan jumlah kuantil apa pun yang kita inginkan:

 #define quantiles of interest
q = c(.2, .4, .6, .8)

#calculate quantiles by grouping variable
df %>%
  group_by(team) %>%
  summarize(quant20 = quantile (wins, probs = q[1]), 
            quant40 = quantile (wins, probs = q[2]),
            quant60 = quantile (wins, probs = q[3]),
            quant80 = quantile (wins, probs = q[4]))

  team quant20 quant40 quant60 quant80
              
1 to 4 4.8 7.4 11.4
2 B 9 10.6 13.2 14.6
3 C 16.8 18.8 19.2 20.6

Anda juga dapat memilih untuk menghitung satu kuantil per grup. Misalnya, berikut cara menghitung persentil ke-90 dari jumlah kemenangan setiap tim:

 #calculate 90th percentile of wins by team
df %>%
  group_by(team) %>%
  summarize(quant90 = quantile (wins, probs = 0.9 ))

   team quant90
     
1 to 13  
2 B 15  
3 C 21.9

Sumber daya tambahan

Cara menghitung kuartil di R
Cara menghitung desil di R
Cara menghitung persentil di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *