Cara menggunakan fungsi droplevels di r (dengan contoh)
Fungsi droplevels() di R dapat digunakan untuk menghapus level faktor yang tidak digunakan.
Fungsi ini sangat berguna jika kita ingin menghapus level faktor yang tidak lagi digunakan karena subset dari vektor atau bingkai data.
Fungsi ini menggunakan sintaks berikut:
tingkat penurunan (x)
dimana x adalah objek untuk menghilangkan tingkat faktor yang tidak terpakai.
Tutorial ini memberikan beberapa contoh cara menggunakan fitur ini dalam praktik.
Contoh 1: Hapus tingkat faktor yang tidak digunakan dalam sebuah vektor
Misalkan kita membuat vektor data dengan lima level faktor. Selanjutnya, misalkan kita mendefinisikan vektor data baru dengan hanya tiga dari lima tingkat faktor awal.
#define data with 5 factor levels data <- factor (c(1, 2, 3, 4, 5)) #define new data as original data minus 4th and 5th factor levels new_data <- data[-c(4, 5)] #view new data new_data [1] 1 2 3 Levels: 1 2 3 4 5
Meskipun data baru hanya memuat tiga faktor, kita dapat melihat bahwa data tersebut masih memuat lima tingkat faktor asli.
Untuk menghapus level faktor yang tidak terpakai ini, kita dapat menggunakan fungsi droplevels() :
#drop unused factor levels new_data < -droplevels (new_data) #view data new_data [1] 1 2 3 Levels: 1 2 3
Data baru sekarang hanya berisi tiga tingkat faktor.
Contoh 2: Hapus level faktor yang tidak digunakan dalam bingkai data
Misalkan kita membuat kerangka data yang salah satu variabelnya merupakan faktor lima tingkat. Selanjutnya, misalkan kita mendefinisikan bingkai data baru yang menghilangkan dua level faktor berikut:
#create data frame df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')), sales = c(13, 16, 22, 27, 34)) #view data frame df regional sales 1 to 13 2 B 16 3 C 22 4 D 27 5 E 34 #define new data frame new_df <- subset (df, sales < 25) #view new data frame new_df regional sales 1 to 13 2 B 16 3 C 22 #check levels of region variable levels (new_df$region) [1] “A” “B” “C” “D” “E”
Meskipun database baru hanya memuat tiga faktor pada kolom wilayah , namun tetap memuat lima tingkat faktor asli. Hal ini akan menimbulkan masalah jika kami mencoba membuat plot menggunakan data ini.
Untuk menghapus tingkat faktor yang tidak terpakai dari variabel wilayah , kita dapat menggunakan fungsi droplevels() :
#drop unused factor levels new_df$region <- droplevels (new_df$region) #check levels of region variable levels (new_df$region) [1] “A” “B” “C”
Kini variabel wilayah hanya memuat tiga level faktor.
Anda dapat menemukan lebih banyak tutorial R di halaman ini .