Cara menghitung peringkat persentil di r (2 contoh)


Peringkat persentil suatu nilai memberi tahu kita persentase nilai dalam kumpulan data yang peringkatnya sama atau lebih rendah dari nilai tertentu.

Anda dapat menggunakan metode berikut untuk menghitung peringkat persentil di R:

Metode 1: Hitung peringkat persentil untuk kumpulan data

 library (dplyr)

df %>%
  mutate(percent_rank = rank(x)/length(x))

Metode 2: Hitung peringkat persentil berdasarkan kelompok

 library (dplyr)

df %>%
  group_by(group_var) %>%
  mutate(percent_rank = rank(x)/length(x))

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut:

 #create data frame
df <- data. frame (team=rep(c('A', 'B'), each= 7 ),
                 points=c(2, 5, 5, 7, 9, 13, 15, 17, 22, 24, 30, 31, 38, 39))

#view data frame
df

   team points
1 TO 2
2 to 5
3 to 5
4 to 7
5 to 9
6 to 13
7 to 15
8 B 17
9 B 22
10 B 24
11 B 30
12 B 31
13 B 38
14 B 39

Contoh 1: Hitung peringkat persentil untuk kumpulan data

Kode berikut menunjukkan cara menggunakan fungsi dari paket dplyr di R untuk menghitung peringkat persentil setiap nilai di kolom poin:

 library (dplyr)

#calculate percentile rank of points values
df %>%
  mutate(percent_rank = rank(points)/length(points))

   team points percent_rank
1 to 2 0.07142857
2 to 5 0.17857143
3 to 5 0.17857143
4 A 7 0.28571429
5 A 9 0.35714286
6 A 13 0.42857143
7 A 15 0.50000000
8 B 17 0.57142857
9 B 22 0.64285714
10 B 24 0.71428571
11 B 30 0.78571429
12 B 31 0.85714286
13 B 38 0.92857143
14 B 39 1.00000000

Berikut cara mengartikan nilai pada kolom persen_rank :

  • 7,14% nilai poin sama dengan atau kurang dari 2.
  • 17,86% nilai poin sama dengan atau kurang dari 5.
  • 28,57% nilai poin sama dengan atau kurang dari 7.

Dan seterusnya.

Contoh 2: Hitung peringkat persentil berdasarkan kelompok

Kode berikut menunjukkan cara menggunakan fungsi dari paket dplyr di R untuk menghitung peringkat persentil setiap nilai di kolom poin, yang dikelompokkan berdasarkan tim:

 library (dplyr)

#calculate percentile rank of points values grouped by team
df %>%
  group_by(team) %>%
  mutate(percent_rank = rank(points)/length(points))

# A tibble: 14 x 3
# Groups: team [2]
   team points percent_rank
             
 1 to 2 0.143
 2 to 5 0.357
 3 to 5 0.357
 4 to 7 0.571
 5 to 9 0.714
 6 to 13 0.857
 7 to 15 1    
 8 B 17 0.143
 9 B 22 0.286
10 B 24 0.429
11 B 30 0.571
12 B 31 0.714
13 B 38 0.857
14 B 39 1

Berikut cara mengartikan nilai pada kolom persen_rank :

  • 14,3% nilai poin Tim A sama dengan atau kurang dari 2.
  • 35,7% nilai poin Tim A sama dengan atau kurang dari 5.
  • 57,1% nilai poin Tim A sama dengan atau kurang dari 7.

Dan seterusnya.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara menghitung persentil di R
Cara menghitung kuartil di R
Cara menghitung kuantil berdasarkan kelompok di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *