J: cara menemukan baris unik di beberapa kolom


Anda dapat menggunakan metode berikut untuk menemukan baris unik di beberapa kolom bingkai data di R:

Metode 1: Temukan baris unik di beberapa kolom (hapus kolom lainnya)

 df_unique <- unique(df[c(' col1 ', ' col2 ')])

Metode 2: Temukan baris unik di beberapa kolom (pertahankan kolom lainnya)

 df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]

Contoh berikut menunjukkan cara menggunakan masing-masing metode ini dalam praktik dengan kerangka data berikut:

 #create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
                 pos=c('G', 'G', 'F', 'G', 'F', 'F'),
                 dots=c(33, 28, 31, 39, 34, 40))

#view data frame
df

  conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40

Metode 1: Temukan baris unik di beberapa kolom (hapus kolom lainnya)

Kode berikut menunjukkan cara menemukan baris unik di kolom conf dan pos pada bingkai data:

 #find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])

#view results
df_unique 

  conf pos
1 East G
3 East
4 West G
5 West

Hasilnya adalah empat garis unik.

Perhatikan juga bahwa kolom poin telah dihapus secara otomatis dari hasil.

Metode 2: Temukan Baris Tunggal di Beberapa Kolom (Hapus Kolom Lainnya)

Kode berikut menunjukkan cara menemukan satu baris di kolom conf dan pos pada bingkai data dan menyimpan nilainya di kolom poin :

 #find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]

#view results
df_unique 

  conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34

Perhatikan bahwa hanya ada satu baris di kolom conf dan pos dan nilai di kolom poin dipertahankan.

Penting untuk dicatat bahwa hanya nilai kejadian unik pertama yang dipertahankan.

Misalnya, ada dua baris yang berisi “Timur” dan “G” di dua kolom pertama, namun hanya nilai titik (33) untuk kemunculan pertama kombinasi unik ini yang dipertahankan di bingkai data akhir.

Demikian pula, ada dua baris yang berisi “Barat” dan “F” di dua kolom pertama, namun hanya nilai titik (34) untuk kemunculan pertama kombinasi unik ini yang dipertahankan dalam bingkai data akhir.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara menemukan nilai unik dalam kolom di R
Cara menghitung nilai unik berdasarkan grup di R
Cara memfilter nilai unik menggunakan dplyr

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *