R'de droplevels fonksiyonu nasıl kullanılır (örneklerle)
Kullanılmayan faktör seviyelerini kaldırmak için R’deki droplevels() işlevi kullanılabilir.
Bu işlev, bir vektörün veya veri çerçevesinin alt kümesi nedeniyle artık kullanılmayan faktör düzeylerini kaldırmak istediğimizde özellikle kullanışlıdır.
Bu işlev aşağıdaki sözdizimini kullanır:
düşme seviyeleri (x)
burada x, kullanılmayan faktör seviyelerinin kaldırılacağı bir nesnedir.
Bu eğitimde bu özelliğin pratikte nasıl kullanılacağına dair bazı örnekler verilmektedir.
Örnek 1: Bir vektörde kullanılmayan faktör seviyelerini kaldırın
Beş faktör seviyesine sahip bir veri vektörü oluşturduğumuzu varsayalım. Daha sonra, orijinal beş faktör düzeyinden yalnızca üçünü içeren yeni bir veri vektörü tanımladığımızı varsayalım.
#define data with 5 factor levels data <- factor (c(1, 2, 3, 4, 5)) #define new data as original data minus 4th and 5th factor levels new_data <- data[-c(4, 5)] #view new data new_data [1] 1 2 3 Levels: 1 2 3 4 5
Yeni veriler her ne kadar sadece üç faktör içerse de orijinal beş faktör seviyesini hala içerdiğini görebiliyoruz.
Bu kullanılmayan faktör seviyelerini kaldırmak için droplevels() fonksiyonunu kullanabiliriz:
#drop unused factor levels new_data < -droplevels (new_data) #view data new_data [1] 1 2 3 Levels: 1 2 3
Yeni veriler artık yalnızca üç düzeyde faktör içeriyor.
Örnek 2: Bir veri çerçevesinde kullanılmayan faktör düzeylerini kaldırın
Değişkenlerden birinin beş seviyeli bir faktör olduğu bir veri çerçevesi oluşturduğumuzu varsayalım. Daha sonra, bu faktör düzeylerinden ikisini ortadan kaldıran yeni bir veri çerçevesi tanımladığımızı varsayalım:
#create data frame df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')), sales = c(13, 16, 22, 27, 34)) #view data frame df regional sales 1 to 13 2 B 16 3 C 22 4 D 27 5 E 34 #define new data frame new_df <- subset (df, sales < 25) #view new data frame new_df regional sales 1 to 13 2 B 16 3 C 22 #check levels of region variable levels (new_df$region) [1] “A” “B” “C” “D” “E”
Yeni veri tabanı bölge sütununda yalnızca üç faktör içermesine rağmen hala orijinal beş faktör seviyesini içermektedir. Bu verileri kullanarak grafikler oluşturmaya çalışırsak bu sorun yaratacaktır.
Kullanılmayan faktör düzeylerini bölge değişkeninden kaldırmak için droplevels() işlevini kullanabiliriz:
#drop unused factor levels new_df$region <- droplevels (new_df$region) #check levels of region variable levels (new_df$region) [1] “A” “B” “C”
Artık bölge değişkeni yalnızca üç düzeyde faktör içeriyor.
Bu sayfada daha fazla R öğreticisi bulabilirsiniz.