Cara menghilangkan baris duplikat di r agar tidak ada lagi yang tersisa


Anda dapat menggunakan metode berikut di R untuk menghapus baris duplikat dari bingkai data sehingga tidak ada yang tersisa di bingkai data yang dihasilkan:

Metode 1: Gunakan Basis R

 new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]

Metode 2: gunakan dplyr

 library (dplyr)

new_df <- df %>%
          group_by(across(everything())) %>%
          filter(n() == 1 )

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(20, 20, 28, 14, 13, 18, 27, 13))

#view data frame
df

  team points
1 to 20
2 to 20
3 to 28
4 to 14
5 B 13
6 B 18
7 B 27
8 B 13

Contoh 1: gunakan Basis R

Kode berikut menunjukkan cara menggunakan fungsi dasar R untuk menghapus baris duplikat dari bingkai data sehingga tidak ada yang tersisa:

 #create new data frame that removes duplicates so none are left
new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]

#view new data frame
new_df

  team points
3 to 28
4 to 14
6 B 18
7 B 27

Perhatikan bahwa setiap baris duplikat telah dihapus dari bingkai data dan tidak ada duplikat yang dipertahankan.

Contoh 2: menggunakan dplyr

Kode berikut menunjukkan cara menggunakan fungsi dalam paket dplyr di R untuk menghapus baris duplikat dari bingkai data sehingga tidak ada yang tersisa:

 library (dplyr)

#create new data frame that removes duplicates so none are left
new_df <- df %>%
          group_by(across(everything())) %>%
          filter(n() == 1 )

#view new data frame
new_df

# A tibble: 4 x 2
# Groups: team, points [4]
  team points
    
1 to 28
2 to 14
3 B 18
4 B 27

Perhatikan bahwa setiap baris duplikat telah dihapus dari bingkai data dan tidak ada duplikat yang dipertahankan.

Perhatikan juga bahwa ini menghasilkan hasil yang sama seperti metode sebelumnya.

Catatan : Untuk frame data yang sangat besar, metode dplyr akan lebih cepat dibandingkan metode dasar R.

Sumber daya tambahan

Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya di R:

Cara menghapus baris di R berdasarkan kondisi
Cara menghapus baris dengan NA di kolom tertentu di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *