Cara menghilangkan baris duplikat di r agar tidak ada lagi yang tersisa
Anda dapat menggunakan metode berikut di R untuk menghapus baris duplikat dari bingkai data sehingga tidak ada yang tersisa di bingkai data yang dihasilkan:
Metode 1: Gunakan Basis R
new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]
Metode 2: gunakan dplyr
library (dplyr) new_df <- df %>% group_by(across(everything())) %>% filter(n() == 1 )
Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'), points=c(20, 20, 28, 14, 13, 18, 27, 13)) #view data frame df team points 1 to 20 2 to 20 3 to 28 4 to 14 5 B 13 6 B 18 7 B 27 8 B 13
Contoh 1: gunakan Basis R
Kode berikut menunjukkan cara menggunakan fungsi dasar R untuk menghapus baris duplikat dari bingkai data sehingga tidak ada yang tersisa:
#create new data frame that removes duplicates so none are left
new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]
#view new data frame
new_df
team points
3 to 28
4 to 14
6 B 18
7 B 27
Perhatikan bahwa setiap baris duplikat telah dihapus dari bingkai data dan tidak ada duplikat yang dipertahankan.
Contoh 2: menggunakan dplyr
Kode berikut menunjukkan cara menggunakan fungsi dalam paket dplyr di R untuk menghapus baris duplikat dari bingkai data sehingga tidak ada yang tersisa:
library (dplyr)
#create new data frame that removes duplicates so none are left
new_df <- df %>%
group_by(across(everything())) %>%
filter(n() == 1 )
#view new data frame
new_df
# A tibble: 4 x 2
# Groups: team, points [4]
team points
1 to 28
2 to 14
3 B 18
4 B 27
Perhatikan bahwa setiap baris duplikat telah dihapus dari bingkai data dan tidak ada duplikat yang dipertahankan.
Perhatikan juga bahwa ini menghasilkan hasil yang sama seperti metode sebelumnya.
Catatan : Untuk frame data yang sangat besar, metode dplyr akan lebih cepat dibandingkan metode dasar R.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menjalankan fungsi umum lainnya di R:
Cara menghapus baris di R berdasarkan kondisi
Cara menghapus baris dengan NA di kolom tertentu di R