Dplyr'da cross() işlevi nasıl kullanılır (3 örnek)
Birden fazla sütuna bir dönüşüm uygulamak için R’deki dplyr paketindeki cross() işlevini kullanabilirsiniz.
Bu özelliği kullanmanın sayısız yolu vardır , ancak aşağıdaki yöntemler birkaç yaygın kullanımı göstermektedir:
Yöntem 1: Bir işlevi birden çok sütuna uygulama
#multiply values in col1 and col2 by 2 df %>% mutate(across(c(col1, col2), function (x) x*2))
Yöntem 2: Birden çok sütun için özet istatistiğini hesaplayın
#calculate mean of col1 and col2 df %>% summarise(across(c(col1, col2), mean, na. rm = TRUE ))
Yöntem 3: Birden Çok Sütun için Çoklu Özet İstatistiklerini Hesaplama
#calculate mean and standard deviation for col1 and col2 df %>% summarise(across(c(col1, col2), list(mean=mean, sd=sd), na. rm = TRUE ))
Aşağıdaki örnekler, her yöntemin aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:
#create data frame df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'), points=c(22, 25, 29, 13, 22, 30), rebounds=c(12, 10, 6, 6, 8, 11)) #view data frame df conf points rebounds 1 East 22 12 2 East 25 10 3 East 29 6 4 West 13 6 5 West 22 8 6 West 30 11
Örnek 1: Bir işlevi birden çok sütuna uygulama
Aşağıdaki kod, sayı ve ribaund sütunlarındaki değerleri 2 ile çarpmak için cross() işlevinin nasıl kullanılacağını gösterir:
library (dplyr)
#multiply values in points and rebounds columns by 2
df %>%
mutate(across(c(points, rebounds), function (x) x*2))
conf points rebounds
1 East 44 24
2 East 50 20
3 East 58 12
4 West 26 12
5 West 44 16
6 West 60 22
Örnek 2: Birden çok sütun için özet istatistiğini hesaplama
Aşağıdaki kod, sayı ve ribaund sütunlarının ortalama değerini hesaplamak için cross() işlevinin nasıl kullanılacağını gösterir:
library (dplyr) #calculate mean value of points an rebounds columns df %>% summarise(across(c(points, rebounds), mean, na. rm = TRUE )) rebound points 1 23.5 8.833333
Veri çerçevesindeki tüm sayısal sütunlar için otomatik olarak bir özet istatistiği hesaplamak amacıyla is.numeric işlevini de kullanabileceğimizi unutmayın:
library (dplyr) #calculate mean value for every numeric column in data frame df %>% summarise(across(where(is. numeric ), mean, na. rm = TRUE )) rebound points 1 23.5 8.833333
Örnek 3: Birden çok sütun için birden çok özet istatistiği hesaplama
Aşağıdaki kod, sayı ve ribaund sütunlarının ortalamasını ve standart sapmasını hesaplamak için cross() işlevinin nasıl kullanılacağını gösterir:
library (dplyr) #calculate mean and standard deviation for points and rebounds columns df %>% summarise(across(c(points, rebounds), list(mean=mean, sd=sd), na. rm = TRUE )) points_mean points_sd rebounds_mean rebounds_sd 1 23.5 6.156298 8.833333 2.562551
Not : cross() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde dplyr kullanılarak diğer yaygın işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Dplyr kullanarak satırlar nasıl silinir
Dplyr kullanarak satırlar nasıl düzenlenir
Dplyr kullanarak birden çok koşula göre filtreleme nasıl yapılır