Cara menghapus baris duplikat di r (dengan contoh)


Anda dapat menggunakan salah satu dari dua metode untuk menghapus baris duplikat dari bingkai data di R:

Metode 1: Gunakan Basis R

 #remove duplicate rows across entire data frame
df[ ! duplicated(df), ]

#remove duplicate rows across specific columns of data frame
df[ ! duplicated(df[c(' var1 ')]), ]

Metode 2: gunakan dplyr

 #remove duplicate rows across entire data frame 
df %>%
  distinct(.keep_all = TRUE )

#remove duplicate rows across specific columns of data frame
df %>%
  distinct(var1, .keep_all = TRUE )

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya dengan bingkai data berikut:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('Guard', 'Guard', 'Forward', 'Guard', 'Center', 'Center'))

#view data frame
df

  team position
1A Guard
2 A Guard
3 A Forward
4 B Guard
5B Center
6B Center

Contoh 1: Hapus baris duplikat menggunakan Basis R

Kode berikut menunjukkan cara menghapus baris duplikat dari bingkai data menggunakan fungsi dasar R:

 #remove duplicate rows from data frame
df[ ! duplicated(df), ]

  team position
1A Guard
3 A Forward
4 B Guard
5B Center

Kode berikut menunjukkan cara menghapus baris duplikat dari kolom tertentu dalam bingkai data menggunakan basis R:

 #remove rows where there are duplicates in the 'team' column
df[ ! duplicated(df[c(' team ')]), ]

  team position
1A Guard
4 B Guard

Contoh 2: Hapus baris duplikat menggunakan dplyr

Kode berikut menunjukkan cara menghapus baris duplikat dari bingkai data menggunakan fungsi berbeda() dari paket dplyr :

 library (dplyr)

#remove duplicate rows from data frame
df %>%
  distinct(.keep_all = TRUE )

  team position
1A Guard
2 A Forward
3 B Guard
4B Center

Perhatikan bahwa argumen .keep_all memberitahu R untuk menyimpan semua kolom dalam bingkai data asli.

Kode berikut menunjukkan cara menggunakan fungsi berbeda() untuk menghapus baris duplikat dari kolom tertentu dalam bingkai data:

 library (dplyr)

#remove duplicate rows from data frame
df %>%
  distinct(team, .keep_all = TRUE )

  team position
1A Guard
2 B Guard

Sumber daya tambahan

Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya di R:

Cara menghapus baris di R berdasarkan kondisi
Cara menghapus baris dengan NA di kolom tertentu di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *