Cara memfilter nilai unik menggunakan dplyr


Anda dapat menggunakan metode berikut untuk memfilter nilai unik dalam bingkai data di R menggunakan paket dplyr :

Metode 1: Filter nilai unik dalam kolom

 df %>% distinct(var1)

Metode 2: Filter nilai unik di beberapa kolom

 df %>% distinct(var1, var2)

Metode 3: Filter nilai unik di semua kolom

 df %>% distinct()

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut di R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

Contoh 1: Filter nilai unik di kolom

Kita dapat menggunakan kode berikut untuk memfilter nilai unik hanya di kolom tim :

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

Perhatikan bahwa hanya nilai unik dari kolom tim yang dikembalikan.

Contoh 2: Filter nilai unik di beberapa kolom

Kita dapat menggunakan kode berikut untuk memfilter nilai unik di kolom tim dan poin :

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

Perhatikan bahwa hanya nilai unik dari kolom tim dan poin yang dikembalikan.

Contoh 3: Filter nilai unik di semua kolom

Kita dapat menggunakan kode berikut untuk memfilter nilai unik di seluruh kolom dalam bingkai data:

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

Perhatikan bahwa nilai unik dari ketiga kolom dikembalikan.

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi terpisah di dplyr di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di dplyr:

Cara memilih kolom berdasarkan indeks menggunakan dplyr
Cara memilih baris pertama berdasarkan grup menggunakan dplyr
Cara memfilter berdasarkan beberapa kondisi menggunakan dplyr
Cara memfilter baris yang berisi string tertentu menggunakan dplyr

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *