Cara menghapus baris duplikat di r (dengan contoh)
Anda dapat menggunakan salah satu dari dua metode untuk menghapus baris duplikat dari bingkai data di R:
Metode 1: Gunakan Basis R
#remove duplicate rows across entire data frame df[ ! duplicated(df), ] #remove duplicate rows across specific columns of data frame df[ ! duplicated(df[c(' var1 ')]), ]
Metode 2: gunakan dplyr
#remove duplicate rows across entire data frame df %>% distinct(.keep_all = TRUE ) #remove duplicate rows across specific columns of data frame df %>% distinct(var1, .keep_all = TRUE )
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya dengan bingkai data berikut:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'), position=c('Guard', 'Guard', 'Forward', 'Guard', 'Center', 'Center')) #view data frame df team position 1A Guard 2 A Guard 3 A Forward 4 B Guard 5B Center 6B Center
Contoh 1: Hapus baris duplikat menggunakan Basis R
Kode berikut menunjukkan cara menghapus baris duplikat dari bingkai data menggunakan fungsi dasar R:
#remove duplicate rows from data frame
df[ ! duplicated(df), ]
team position
1A Guard
3 A Forward
4 B Guard
5B Center
Kode berikut menunjukkan cara menghapus baris duplikat dari kolom tertentu dalam bingkai data menggunakan basis R:
#remove rows where there are duplicates in the 'team' column
df[ ! duplicated(df[c(' team ')]), ]
team position
1A Guard
4 B Guard
Contoh 2: Hapus baris duplikat menggunakan dplyr
Kode berikut menunjukkan cara menghapus baris duplikat dari bingkai data menggunakan fungsi berbeda() dari paket dplyr :
library (dplyr) #remove duplicate rows from data frame df %>% distinct(.keep_all = TRUE ) team position 1A Guard 2 A Forward 3 B Guard 4B Center
Perhatikan bahwa argumen .keep_all memberitahu R untuk menyimpan semua kolom dalam bingkai data asli.
Kode berikut menunjukkan cara menggunakan fungsi berbeda() untuk menghapus baris duplikat dari kolom tertentu dalam bingkai data:
library (dplyr) #remove duplicate rows from data frame df %>% distinct(team, .keep_all = TRUE ) team position 1A Guard 2 B Guard
Sumber daya tambahan
Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya di R:
Cara menghapus baris di R berdasarkan kondisi
Cara menghapus baris dengan NA di kolom tertentu di R