Cara menggunakan fungsi droplevels di r (dengan contoh)


Fungsi droplevels() di R dapat digunakan untuk menghapus level faktor yang tidak digunakan.

Fungsi ini sangat berguna jika kita ingin menghapus level faktor yang tidak lagi digunakan karena subset dari vektor atau bingkai data.

Fungsi ini menggunakan sintaks berikut:

tingkat penurunan (x)

dimana x adalah objek untuk menghilangkan tingkat faktor yang tidak terpakai.

Tutorial ini memberikan beberapa contoh cara menggunakan fitur ini dalam praktik.

Contoh 1: Hapus tingkat faktor yang tidak digunakan dalam sebuah vektor

Misalkan kita membuat vektor data dengan lima level faktor. Selanjutnya, misalkan kita mendefinisikan vektor data baru dengan hanya tiga dari lima tingkat faktor awal.

 #define data with 5 factor levels
data <- factor (c(1, 2, 3, 4, 5))

#define new data as original data minus 4th and 5th factor levels
new_data <- data[-c(4, 5)]

#view new data
new_data

[1] 1 2 3
Levels: 1 2 3 4 5

Meskipun data baru hanya memuat tiga faktor, kita dapat melihat bahwa data tersebut masih memuat lima tingkat faktor asli.

Untuk menghapus level faktor yang tidak terpakai ini, kita dapat menggunakan fungsi droplevels() :

 #drop unused factor levels
new_data < -droplevels (new_data)

#view data
new_data

[1] 1 2 3
Levels: 1 2 3

Data baru sekarang hanya berisi tiga tingkat faktor.

Contoh 2: Hapus level faktor yang tidak digunakan dalam bingkai data

Misalkan kita membuat kerangka data yang salah satu variabelnya merupakan faktor lima tingkat. Selanjutnya, misalkan kita mendefinisikan bingkai data baru yang menghilangkan dua level faktor berikut:

 #create data frame
df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')),
                 sales = c(13, 16, 22, 27, 34))

#view data frame
df

  regional sales
1 to 13
2 B 16
3 C 22
4 D 27
5 E 34

#define new data frame
new_df <- subset (df, sales < 25)

#view new data frame
new_df

  regional sales
1 to 13
2 B 16
3 C 22

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C” “D” “E”

Meskipun database baru hanya memuat tiga faktor pada kolom wilayah , namun tetap memuat lima tingkat faktor asli. Hal ini akan menimbulkan masalah jika kami mencoba membuat plot menggunakan data ini.

Untuk menghapus tingkat faktor yang tidak terpakai dari variabel wilayah , kita dapat menggunakan fungsi droplevels() :

 #drop unused factor levels
new_df$region <- droplevels (new_df$region)

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C”

Kini variabel wilayah hanya memuat tiga level faktor.

Anda dapat menemukan lebih banyak tutorial R di halaman ini .

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *