Cara menambahkan level baru ke faktor r (dengan contoh)


Anda dapat menggunakan sintaks dasar berikut untuk menambahkan level baru ke variabel faktor di R:

 levels(df$my_factor) <- c(levels(df$my_factor), ' new_level ')

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Tambahkan level baru ke faktor di R

Misalkan kita memiliki kerangka data berikut di R yang menunjukkan jumlah penjualan yang dilakukan di berbagai wilayah untuk sebuah toko ritel:

 #create data frame
df <- data. frame (region=factor(c('A', 'B', NA, 'D', NA, 'F')),
                 sales=c(12, 18, 21, 14, 34, 40))

#view data frame
df

  regional sales
1 to 12
2 B 18
3 <NA> 21
4 D 14
5 <NA> 34
6 F 40

Perhatikan bahwa variabel wilayah adalah sebuah faktor.

Untuk memvisualisasikan level faktor ini, kita dapat menggunakan fungsi level() :

 #view factor levels for region
levels(df$region)

[1] “A” “B” “D” “F”

Kita dapat menggunakan sintaks berikut untuk menambahkan tingkat faktor baru yang disebut “tidak ada wilayah”:

 #add factor level called 'no region'
levels(df$region) <- c(levels(df$region), ' no region ')

#convert each NA to 'no region'
df$region[is. na (df$region)] <- ' no region '

#view factor levels for region
levels(df$region)

[1] “A” “B” “D” “F” “no region”

Level baru yang disebut “tidak ada wilayah” telah ditambahkan sebagai level faktor.

Jika diinginkan, kita dapat menggunakan fungsi table() untuk menghitung kemunculan setiap level faktor:

 #view occurrences of each factor level
table(df$region)

ABDF no region 
1 1 1 1 2 

Dari hasilnya, kita dapat melihat bahwa level faktor baru yang disebut “tidak ada wilayah” muncul dua kali di kolom wilayah pada bingkai data.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara mengubah faktor menjadi numerik di R
Cara mengubah faktor menjadi karakter di R
Cara mengatur ulang level faktor di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *