Mutate() ve case_when() ile r'de yeni değişkenler oluşturun
Çoğunlukla belirli koşullara dayalı olarak R’deki bir veri çerçevesinde yeni bir değişken oluşturmak isteyebilirsiniz. Neyse ki, dplyr paketindeki mutate() ve case_when() işlevlerini kullanarak bunu yapmak kolaydır.
Bu eğitimde, bu işlevleri aşağıdaki veri çerçevesiyle kullanmanın birkaç örneği gösterilmektedir:
#create data frame df <- data.frame(player = c('a', 'b', 'c', 'd', 'e'), position = c('G', 'F', 'F', 'G', 'G'), points = c(12, 15, 19, 22, 32), rebounds = c(5, 7, 7, 12, 11)) #view data frame df player position points rebounds 1 to G 12 5 2 b F 15 7 3 c F 19 7 4 d G 22 12 5th G 32 11
Örnek 1: Mevcut bir değişkeni temel alarak yeni bir değişken oluşturun
Aşağıdaki kod, puan sütunundaki değere dayalı olarak “puanlayıcı” adı verilen yeni bir değişkenin nasıl oluşturulacağını gösterir:
library(dplyr) #define new variable 'scorer' using mutate() and case_when() df %>% mutate (scorer = case_when (points < 15 ~ ' low ', points < 25 ~ ' med ', points < 35 ~ ' high ')) player position points rebounds scorer 1 a G 12 5 low 2 b F 15 7 med 3 c F 19 7 med 4 d G 22 12 med 5th G 32 11 high
Örnek 2: Mevcut birkaç değişkene dayalı olarak yeni bir değişken oluşturun
Aşağıdaki kod, oynatıcı ve konum sütunundaki değere göre “type” adlı yeni bir değişkenin nasıl oluşturulacağını gösterir:
library(dplyr) #define new variable 'type' using mutate() and case_when() df %>% mutate (type = case_when (player == 'a' | player == 'b' ~ ' starter ', player == 'c' | player == 'd' ~ ' backup ', position == 'G' ~ ' reserve ')) player position points rebounds type 1 a G 12 5 starter 2 b F 15 7 starter 3 c F 19 7 backup 4 d G 22 12 backup 5th G 32 11 reserve
Aşağıdaki kod, puan ve ribaund sütunlarının değerine dayalı olarak “valueAdded” adlı yeni bir değişkenin nasıl oluşturulacağını gösterir:
library(dplyr) #define new variable 'valueAdded' using mutate() and case_when() df %>% mutate (valueAdded = case_when (points <= 15 & rebounds <=5 ~ 2, points <=15 & rebounds > 5 ~ 4, points < 25 & rebounds < 8 ~ 6, points < 25 & rebounds > 8 ~ 7, points >=25 ~ 9)) player position points rebounds valueAdded 1 to G 12 5 2 2 b F 15 7 4 3c F 19 7 6 4 d G 22 12 7 5th G 32 11 9
Ek kaynaklar
R’deki sütunlar nasıl yeniden adlandırılır
R’deki sütunlar nasıl silinir
R’deki satırlar nasıl filtrelenir