Cara menggunakan fungsi ntile() di dplyr (dengan contoh)
Anda dapat menggunakan fungsi ntile() dari paket dplyr di R untuk membagi vektor input menjadi n bin.
Fungsi ini menggunakan sintaks dasar berikut:
ntil(x, n)
Emas:
- x : vektor masukan
- n : Jumlah kompartemen
Catatan : Ukuran ember mungkin berbeda hingga satu.
Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.
Contoh 1: Gunakan ntile() dengan vektor
Kode berikut menunjukkan cara menggunakan fungsi ntile() untuk membagi vektor 11 elemen menjadi 5 keranjang berbeda:
library (dplyr) #createvector x <- c(1, 3, 4, 6, 7, 8, 10, 13, 19, 22, 23) #break up vector into 5 buckets ntile(x, 5) [1] 1 1 1 2 2 3 3 4 4 5 5
Dari hasilnya, kita dapat melihat bahwa setiap elemen vektor asli ditempatkan di salah satu dari lima keranjang.
Nilai terkecil ditetapkan pada bucket 1 sedangkan nilai terbesar ditetapkan pada bucket 5.
Misalnya:
- Nilai terkecil dari 1, 3 dan 4 ditetapkan ke keranjang 1 .
- Nilai terbesar, 22 dan 23, ditetapkan ke keranjang 5 .
Contoh 2: Menggunakan ntile() dengan bingkai data
Misalkan kita memiliki kerangka data berikut di R yang menunjukkan poin yang dicetak oleh pemain bola basket yang berbeda:
#create data frame df <- data. frame (player=LETTERS[1:9], points=c(12, 19, 7, 22, 24, 28, 30, 19, 15)) #view data frame df player points 1 to 12 2 B 19 3 C 7 4 D 22 5 E 24 6 F 28 7 G 30 8:19 a.m. 9 I 15
Kode berikut menunjukkan cara menggunakan fungsi ntile() untuk membuat kolom baru dalam bingkai data yang menugaskan setiap pemain ke salah satu dari tiga keranjang, berdasarkan poin yang dicetak:
library (dplyr) #create new column that assigns players into buckets based on points df$bucket <- ntile(df$points, 3) #view updated data frame df player points bucket 1 to 12 1 2 B 19 2 3 C 7 1 4 D 22 2 5 E 24 3 6 F 28 3 7 G 30 3 8:19 2 9 I 15 1
Kolom keranjang baru memberikan nilai antara 1 dan 3 untuk setiap pemain.
Pemain dengan poin terendah mendapat nilai 1 dan pemain dengan poin tertinggi mendapat nilai 3 .
Sumber daya tambahan
Tutorial berikut menjelaskan cara menggunakan fungsi umum lainnya di R:
Cara menggunakan fungsicross() di dplyr
Cara menggunakan fungsi relokasi() di dplyr
Cara menggunakan fungsi irisan() di dplyr