R'de droplevels fonksiyonu nasıl kullanılır (örneklerle)


Kullanılmayan faktör seviyelerini kaldırmak için R’deki droplevels() işlevi kullanılabilir.

Bu işlev, bir vektörün veya veri çerçevesinin alt kümesi nedeniyle artık kullanılmayan faktör düzeylerini kaldırmak istediğimizde özellikle kullanışlıdır.

Bu işlev aşağıdaki sözdizimini kullanır:

düşme seviyeleri (x)

burada x, kullanılmayan faktör seviyelerinin kaldırılacağı bir nesnedir.

Bu eğitimde bu özelliğin pratikte nasıl kullanılacağına dair bazı örnekler verilmektedir.

Örnek 1: Bir vektörde kullanılmayan faktör seviyelerini kaldırın

Beş faktör seviyesine sahip bir veri vektörü oluşturduğumuzu varsayalım. Daha sonra, orijinal beş faktör düzeyinden yalnızca üçünü içeren yeni bir veri vektörü tanımladığımızı varsayalım.

 #define data with 5 factor levels
data <- factor (c(1, 2, 3, 4, 5))

#define new data as original data minus 4th and 5th factor levels
new_data <- data[-c(4, 5)]

#view new data
new_data

[1] 1 2 3
Levels: 1 2 3 4 5

Yeni veriler her ne kadar sadece üç faktör içerse de orijinal beş faktör seviyesini hala içerdiğini görebiliyoruz.

Bu kullanılmayan faktör seviyelerini kaldırmak için droplevels() fonksiyonunu kullanabiliriz:

 #drop unused factor levels
new_data < -droplevels (new_data)

#view data
new_data

[1] 1 2 3
Levels: 1 2 3

Yeni veriler artık yalnızca üç düzeyde faktör içeriyor.

Örnek 2: Bir veri çerçevesinde kullanılmayan faktör düzeylerini kaldırın

Değişkenlerden birinin beş seviyeli bir faktör olduğu bir veri çerçevesi oluşturduğumuzu varsayalım. Daha sonra, bu faktör düzeylerinden ikisini ortadan kaldıran yeni bir veri çerçevesi tanımladığımızı varsayalım:

 #create data frame
df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')),
                 sales = c(13, 16, 22, 27, 34))

#view data frame
df

  regional sales
1 to 13
2 B 16
3 C 22
4 D 27
5 E 34

#define new data frame
new_df <- subset (df, sales < 25)

#view new data frame
new_df

  regional sales
1 to 13
2 B 16
3 C 22

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C” “D” “E”

Yeni veri tabanı bölge sütununda yalnızca üç faktör içermesine rağmen hala orijinal beş faktör seviyesini içermektedir. Bu verileri kullanarak grafikler oluşturmaya çalışırsak bu sorun yaratacaktır.

Kullanılmayan faktör düzeylerini bölge değişkeninden kaldırmak için droplevels() işlevini kullanabiliriz:

 #drop unused factor levels
new_df$region <- droplevels (new_df$region)

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C”

Artık bölge değişkeni yalnızca üç düzeyde faktör içeriyor.

Bu sayfada daha fazla R öğreticisi bulabilirsiniz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir