Cara memfilter nilai unik menggunakan dplyr
Anda dapat menggunakan metode berikut untuk memfilter nilai unik dalam bingkai data di R menggunakan paket dplyr :
Metode 1: Filter nilai unik dalam kolom
df %>% distinct(var1)
Metode 2: Filter nilai unik di beberapa kolom
df %>% distinct(var1, var2)
Metode 3: Filter nilai unik di semua kolom
df %>% distinct()
Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut di R:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7
Contoh 1: Filter nilai unik di kolom
Kita dapat menggunakan kode berikut untuk memfilter nilai unik hanya di kolom tim :
library (dplyr)
#select only unique values in team column
df %>% distinct(team)
team
1A
2 B
Perhatikan bahwa hanya nilai unik dari kolom tim yang dikembalikan.
Contoh 2: Filter nilai unik di beberapa kolom
Kita dapat menggunakan kode berikut untuk memfilter nilai unik di kolom tim dan poin :
library (dplyr)
#select unique values in team and points columns
df %>% distinct(team, points)
team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12
Perhatikan bahwa hanya nilai unik dari kolom tim dan poin yang dikembalikan.
Contoh 3: Filter nilai unik di semua kolom
Kita dapat menggunakan kode berikut untuk memfilter nilai unik di seluruh kolom dalam bingkai data:
library (dplyr)
#select unique values across all columns
df %>% distinct()
team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7
Perhatikan bahwa nilai unik dari ketiga kolom dikembalikan.
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi terpisah di dplyr di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di dplyr:
Cara memilih kolom berdasarkan indeks menggunakan dplyr
Cara memilih baris pertama berdasarkan grup menggunakan dplyr
Cara memfilter berdasarkan beberapa kondisi menggunakan dplyr
Cara memfilter baris yang berisi string tertentu menggunakan dplyr