Dplyr'de case_when() nasıl kullanılır

İle Dr.benjamin anderson Temmuz 24, 2023 Rehber 0 Yorum

R’deki dplyr paketindeki case_when() işlevi, mevcut değişkenlerden yeni değişkenler oluşturmak için kullanılabilir.

Bu işlev aşağıdaki temel sözdizimini kullanır:

 library (dplyr)

df %>%
  mutate (new_var = case_when (var1 < 15 ~ ' low ',
                             var2 < 25 ~ ' med ',
                             TRUE ~ ' high '))

TRUE’nun “else” ifadesine eşdeğer olduğunu unutmayın.

Aşağıdaki örnekler, bu işlevin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (player = c('AJ', 'Bob', 'Chad', 'Dan', 'Eric', 'Frank'),
                 position = c('G', 'F', 'F', 'G', 'C', NA),
                 points = c(12, 15, 19, 22, 32, NA),
                 assists = c(5, 7, 7, 12, 11, NA))

#view data frame
df

  player position points assists
1 AJ G 12 5
2 Bob F 15 7
3 Chad F 19 7
4 Dan G 22 12
5 Eric C 32 11
6 Frank NA NA NA

Örnek 1: Mevcut bir değişkenden yeni bir değişken oluşturma

Aşağıdaki kod, değerleri puan sütunundan türetilen, kalite adı verilen yeni bir değişkenin nasıl oluşturulacağını gösterir:

 df %>%
mutate (quality = case_when (points > 20 ~ ' high ',
                             points > 15 ~ ' med ',
                             TRUE ~ ' low ' ))

  player position points assists quality
1 AJ G 12 5 low
2 Bob F 15 7 low
3 Chad F 19 7 med
4 Dan G 22 12 high
5 Eric C 32 11 high
6 Frank NA NA NA low

Case_when() fonksiyonunun yeni sütun için değerleri tam olarak nasıl oluşturduğu aşağıda açıklanmıştır:

Puan sütunundaki değer 20’den büyükse kalite sütunundaki değer “yüksek” olur.
Aksi takdirde puan sütunundaki değer 15’ten büyükse kalite sütunundaki değer “med” olur.
Aksi takdirde, puan sütunundaki değer 15’ten küçük veya ona eşitse (veya NA gibi eksik bir değerse), kalite sütunundaki değer “düşük” olur.

Örnek 2: Birden çok değişkenden yeni bir değişken oluşturma

Aşağıdaki kod, değerleri noktalardan ve destek sütunlarından türetilen, kalite adı verilen yeni bir değişkenin nasıl oluşturulacağını gösterir:

 df %>%
mutate (quality = case_when (points > 15 & assists > 10 ~ ' great ',
                             points > 15 & assists > 5 ~ ' good ',
                             TRUE ~ ' average ' ))

  player position points assists quality
1 AJ G 12 5 average
2 Bob F 15 7 average
3 Chad F 19 7 good
4 Dan G 22 12 great
5 Eric C 32 11 great
6 Frank NA NA NA average

Dizeleri NA değerlerine açıkça atamak için is.na() işlevini de kullanabileceğimizi unutmayın:

 df %>%
mutate (quality = case_when (is. na (points) ~ ' missing ',
                             points > 15 & assists > 10 ~ ' great ',
                             points > 15 & assists > 5 ~ ' good ',
                             TRUE ~ ' average ' ))

  player position points assists quality
1 AJ G 12 5 average
2 Bob F 15 7 average
3 Chad F 19 7 good
4 Dan G 22 12 great
5 Eric C 32 11 great
6 Frank NA NA NA missing

Ek kaynaklar

R’de çizgiler nasıl düzenlenir
R’de grup başına gözlemler nasıl sayılır?
R’de belirli bir dize içeren satırlar nasıl filtrelenir

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Örnek 1: Mevcut bir değişkenden yeni bir değişken oluşturma

Örnek 2: Birden çok değişkenden yeni bir değişken oluşturma

Ek kaynaklar

yazar hakkında

Dr.benjamin anderson

Yorum ekle