Cara menggunakan fungsi ntile() di dplyr (dengan contoh)


Anda dapat menggunakan fungsi ntile() dari paket dplyr di R untuk membagi vektor input menjadi n bin.

Fungsi ini menggunakan sintaks dasar berikut:

ntil(x, n)

Emas:

  • x : vektor masukan
  • n : Jumlah kompartemen

Catatan : Ukuran ember mungkin berbeda hingga satu.

Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.

Contoh 1: Gunakan ntile() dengan vektor

Kode berikut menunjukkan cara menggunakan fungsi ntile() untuk membagi vektor 11 elemen menjadi 5 keranjang berbeda:

 library (dplyr)

#createvector
x <- c(1, 3, 4, 6, 7, 8, 10, 13, 19, 22, 23)

#break up vector into 5 buckets
ntile(x, 5)

 [1] 1 1 1 2 2 3 3 4 4 5 5

Dari hasilnya, kita dapat melihat bahwa setiap elemen vektor asli ditempatkan di salah satu dari lima keranjang.

Nilai terkecil ditetapkan pada bucket 1 sedangkan nilai terbesar ditetapkan pada bucket 5.

Misalnya:

  • Nilai terkecil dari 1, 3 dan 4 ditetapkan ke keranjang 1 .
  • Nilai terbesar, 22 dan 23, ditetapkan ke keranjang 5 .

Contoh 2: Menggunakan ntile() dengan bingkai data

Misalkan kita memiliki kerangka data berikut di R yang menunjukkan poin yang dicetak oleh pemain bola basket yang berbeda:

 #create data frame
df <- data. frame (player=LETTERS[1:9],
                 points=c(12, 19, 7, 22, 24, 28, 30, 19, 15))

#view data frame
df

  player points
1 to 12
2 B 19
3 C 7
4 D 22
5 E 24
6 F 28
7 G 30
8:19 a.m.
9 I 15

Kode berikut menunjukkan cara menggunakan fungsi ntile() untuk membuat kolom baru dalam bingkai data yang menugaskan setiap pemain ke salah satu dari tiga keranjang, berdasarkan poin yang dicetak:

 library (dplyr)

#create new column that assigns players into buckets based on points
df$bucket <- ntile(df$points, 3)

#view updated data frame
df

  player points bucket
1 to 12 1
2 B 19 2
3 C 7 1
4 D 22 2
5 E 24 3
6 F 28 3
7 G 30 3
8:19 2
9 I 15 1

Kolom keranjang baru memberikan nilai antara 1 dan 3 untuk setiap pemain.

Pemain dengan poin terendah mendapat nilai 1 dan pemain dengan poin tertinggi mendapat nilai 3 .

Sumber daya tambahan

Tutorial berikut menjelaskan cara menggunakan fungsi umum lainnya di R:

Cara menggunakan fungsicross() di dplyr
Cara menggunakan fungsi relokasi() di dplyr
Cara menggunakan fungsi irisan() di dplyr

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *