Cara memilih satu baris dalam bingkai data di r


Anda dapat menggunakan metode berikut untuk memilih satu baris dalam bingkai data di R:

Metode 1: Pilih Baris Tunggal di Semua Kolom

 library (dplyr)

df %>% distinct()

Metode 2: Pilih Baris Tunggal Berdasarkan Kolom

 library (dplyr)

df %>% distinct(column1, . keep_all = TRUE )

Metode 3: Pilih Baris Tunggal Berdasarkan Beberapa Kolom

 library (dplyr)

df %>% distinct(column1, column2, . keep_all = TRUE )

Tutorial ini menjelaskan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(10, 10, 8, 14, 15, 15, 17, 17))

#view data frame
df

  team position points
1 AG 10
2 AG 10
3AF 8
4 AF 14
5 BG 15
6 BG 15
7 BF 17
8 BF 17

Contoh 1: Pilih baris unik di semua kolom

Kode berikut menunjukkan cara memilih baris dengan nilai unik di seluruh kolom dalam bingkai data:

 library (dplyr)

#select rows with unique values across all columns
df %>% distinct()

  team position points
1 AG 10
2AF 8
3 AF 14
4 BG 15
5 BF 17

Kita dapat melihat ada lima baris unik dalam bingkai data.

Catatan : Jika ditemukan baris duplikat, hanya baris unik pertama yang dipertahankan.

Contoh 2: Pilih Baris Tunggal Berdasarkan Kolom

Kode berikut memperlihatkan cara memilih satu baris berdasarkan kolom tim saja.

 library (dplyr)

#select rows with unique values based on team column only
df %>% distinct(team, . keep_all = TRUE )

  team position points
1 AG 10
2 BG 15

Karena hanya ada dua nilai unik di kolom Tim , hanya baris dengan kemunculan pertama dari setiap nilai yang disimpan.

Catatan : Argumen .keep_all=TRUE memberitahu R untuk menyimpan semua kolom lain di output.

Contoh 3: Pilih Baris Tunggal Berdasarkan Beberapa Kolom

Kode berikut menunjukkan cara memilih satu baris berdasarkan kolom tim dan posisi saja.

 library (dplyr)

#select rows with unique values based on team and position columns only
df %>% distinct(team, position, . keep_all = TRUE )

  team position points
1 AG 10
2AF 8
3 BG 15
4 BF 17

Empat baris dikembalikan karena ada empat kombinasi nilai unik di kolom Tim dan Posisi .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara memfilter nilai unik menggunakan dplyr
Cara memfilter berdasarkan beberapa kondisi menggunakan dplyr
Cara menghitung jumlah kemunculan pada kolom di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *