Cara subset bingkai data di r (4 contoh)
Anda dapat menggunakan sintaks dasar berikut untuk membuat subset bingkai data di R:
df[rows, columns]
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya dengan bingkai data berikut:
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C'), points=c(77, 81, 89, 83, 99, 92, 97), assists=c(19, 22, 29, 15, 32, 39, 14)) #view data frame df team points assists 1 A 77 19 2 A 81 22 3 B 89 29 4 B 83 15 5 C 99 32 6 C 92 39 7 C 97 14
Contoh 1: Subset bingkai data dengan memilih kolom
Kode berikut menunjukkan cara mengelompokkan bingkai data berdasarkan nama kolom:
#select all rows for columns 'team' and 'assists'
df[, c(' team ', ' assists ')]
team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14
Kita juga dapat mengelompokkan bingkai data berdasarkan nilai indeks kolom:
#select all rows for columns 1 and 3
df[, c(1, 3)]
team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14
Contoh 2: Subset bingkai data tidak termasuk kolom
Kode berikut menunjukkan cara membuat subset bingkai data dengan mengecualikan nama kolom tertentu:
#define columns to exclude
cols <- names(df) %in% c(' points ')
#exclude points column
df[!cols]
team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14
Kami juga dapat mengecualikan kolom menggunakan nilai indeks
#exclude column 2
df[, c(-2)]
team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14
Contoh 3: Subset bingkai data dengan memilih baris
Kode berikut menunjukkan cara mengelompokkan bingkai data berdasarkan baris tertentu:
#select rows 1, 5, and 7 df[c(1, 5, 7), ] team points assists 1 A 77 19 5 C 99 32 7 C 97 14
Kita juga dapat mengelompokkan bingkai data dengan memilih rentang baris:
#select rows 1 through 5 df[1:5, ] team points assists 1 A 77 19 2 A 81 22 3 B 89 29 4 B 83 15 5 C 99 32
Contoh 4: Subset bingkai data berdasarkan kondisi
Kode berikut menunjukkan cara menggunakan fungsi subset() untuk memilih baris dan kolom yang memenuhi kondisi tertentu:
#select rows where points is greater than 90
subset(df, points > 90)
team points assists
5 C 99 32
6 C 92 39
7 C 97 14
Kita juga dapat menggunakan | Operator (“atau”) untuk memilih baris yang memenuhi salah satu ketentuan berikut:
#select rows where points is greater than 90 or less than 80
subset(df, points > 90 | points < 80)
team points assists
1 A 77 19
5 C 99 32
6 C 92 39
7 C 97 14
Kita juga dapat menggunakan operator & (“dan”) untuk memilih baris yang memenuhi beberapa kondisi:
#select rows where points is greater than 90 and assists is greater than 30
subset(df, points > 90 & assists > 30)
team points assists
5 C 99 32
6 C 92 39
Kita juga bisa menggunakan argumen pilih untuk memilih kolom tertentu saja berdasarkan kondisi:
#select rows where points is greater than 90 and only show 'team' column
subset(df, points > 90, select=c(' team '))
team
5C
6C
7C
Sumber daya tambahan
Cara menghapus baris dari bingkai data di R berdasarkan kondisi
Bagaimana cara mengganti nilai dalam bingkai data di R
Cara menghapus kolom dari bingkai data di R