Dplyr'de coalesce() işlevi nasıl kullanılır (örneklerle)


Bir veya daha fazla vektörün her konumundaki ilk eksik olmayan değeri döndürmek için R’deki dplyr paketindeki coalesce() işlevini kullanabilirsiniz.

Bu işlevi kullanmanın iki yaygın yolu vardır:

Yöntem 1: Vektördeki eksik değerleri değiştirin

 library (dplyr)

#replace missing values with 100
coalescence(x, 100)

Yöntem 2: Veri çerçevesi sütunlarındaki ilk eksik olmayan değeri döndür

 library (dplyr)

#return first non-missing value at each position across columns A and B
coalesce(df$A, df$B)

Aşağıdaki örnekler her yöntemin pratikte nasıl uygulanacağını göstermektedir.

Örnek 1: Vektördeki eksik değerleri değiştirmek için coalesce() işlevini kullanın

Aşağıdaki kod, bir vektördeki tüm eksik değerleri 100 değeriyle değiştirmek için coalesce() işlevinin nasıl kullanılacağını gösterir:

 library (dplyr)

#create vector of values
x <- c(4, NA, 12, NA, 5, 14, 19)

#replace missing values with 100
coalescence(x, 100)

[1] 4 100 12 100 5 14 19

Orijinal vektördeki her NA değerinin 100 değeriyle değiştirildiğini unutmayın.

Örnek 2: Veri çerçevesi sütunlarındaki ilk eksik olmayan değeri döndürmek için coalesce() işlevini kullanın

R’de aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (A=c(10, NA, 5, 6, NA, 7, NA),
                 B=c(14, 9, NA, 3, NA, 10, 4))

#view data frame
df

   AB
1 10 14
2 NA 9
3 5 NA
4 6 3
5 NA NA
6 7 10
7 NA 4

Aşağıdaki kod, veri çerçevesinin A ve B sütunlarındaki ilk eksik olmayan değeri döndürmek için coalesce() işlevinin nasıl kullanılacağını gösterir:

 library (dplyr)

#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B)

#view updated data frame
df

   ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA NA
6 7 10 7
7 NA 4 4

Ortaya çıkan C sütunu, A ve B sütunlarındaki ilk eksik olmayan değeri içerir.

A ve B sütunlarının her ikisinin de bu satırda NA değerleri olması nedeniyle 5. satırın C sütununda NA değerine sahip olduğuna dikkat edin.

Her sütunda NA değerleri varsa , coalesce() fonksiyonuna değer olarak kullanmak üzere ekstra bir değer ekleyebiliriz:

 library (dplyr)

#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B, 100)

#view updated data frame
df

   ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA 100
6 7 10 7
7 NA 4 4

C sütununun 5. satırındaki NA değerinin artık 100 değeriyle değiştirildiğini unutmayın.

Ek kaynaklar

Aşağıdaki eğitimlerde dplyr kullanılarak diğer yaygın işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Dplyr kullanarak satırlar nasıl silinir
Dplyr kullanarak satırlar nasıl düzenlenir
Dplyr kullanarak birden çok koşula göre filtreleme nasıl yapılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir