Cara mengelompokkan bingkai data di r berdasarkan beberapa kondisi


Anda dapat menggunakan metode berikut untuk mendefinisikan subbingkai data berdasarkan beberapa kondisi di R:

Metode 1: Subset bingkai data menggunakan logika “OR”.

 df_sub <- subset(df, team == ' A ' | points < 20 )

Contoh khusus ini akan mengelompokkan bingkai data untuk baris dengan kolom tim sama dengan “A” atau kolom poin kurang dari 20.

Metode 2: Subset bingkai data menggunakan logika “DAN”.

 df_sub <- subset(df, team == ' A ' & points < 20 )

Contoh khusus ini akan mengelompokkan bingkai data untuk baris dengan kolom tim sama dengan “A” dan kolom poin kurang dari 20.

Tutorial ini menjelaskan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('Guard', 'Guard', 'Forward',
                            'Guard', 'Forward', 'Forward'),
                 dots=c(22, 25, 19, 22, 12, 35))

#view data frame
df

  team position points
1 A Guard 22
2 A Guard 25
3 A Forward 19
4 B Guard 22
5 B Forward 12
6 B Forward 35

Contoh 1: Subset bingkai data menggunakan logika “OR”.

Kode berikut menunjukkan cara membuat subset bingkai data untuk baris dengan kolom tim sama dengan “A” atau kolom poin kurang dari 20:

 #subset data frame where team is 'A' or points is less than 20
df_sub <- subset(df, team == ' A ' | points < 20 )

#view subset
df_sub

  team position points
1 A Guard 22
2 A Guard 25
3 A Forward 19
5 B Forward 12

Masing-masing baris dalam himpunan bagian mempunyai nilai “A” di kolom tim atau nilai di kolom poin kurang dari 20.

Catatan : | simbol mewakili “ATAU” di R.

Dalam contoh ini, kita hanya menyertakan satu simbol “ATAU” dalam fungsi subset() namun kita dapat menyertakan sebanyak yang kita inginkan ke dalam subset berdasarkan lebih banyak kondisi.

Contoh 2: Subset bingkai data menggunakan logika “DAN”.

Kode berikut menunjukkan cara membuat subset bingkai data untuk baris dengan kolom tim sama dengan “A” dan kolom poin kurang dari 20:

 #subset data frame where team is 'A' and points is less than 20
df_sub <- subset(df, team == ' A ' & points < 20 )

#view subset
df_sub

  team position points
3 A Forward 19

Perhatikan bahwa subset yang dihasilkan hanya berisi satu baris.

Memang benar, hanya satu baris yang mempunyai nilai “A” pada kolom tim dan nilai pada kolom poin kurang dari 20.

Catatan : Simbol & mewakili “DAN” di R.

Dalam contoh ini, kita hanya menyertakan satu simbol “AND” dalam fungsi subset() namun kita dapat menyertakan sebanyak yang kita inginkan ke dalam subset berdasarkan lebih banyak kondisi.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara memilih satu baris dalam bingkai data di R
Cara memilih baris dengan nilai NA di R
Cara memilih baris berdasarkan nilai vektor di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *