Dplyr'da cross() işlevi nasıl kullanılır (3 örnek)

İle Dr.benjamin anderson Temmuz 18, 2023 Rehber 0 Yorum

Birden fazla sütuna bir dönüşüm uygulamak için R’deki dplyr paketindeki cross() işlevini kullanabilirsiniz.

Bu özelliği kullanmanın sayısız yolu vardır , ancak aşağıdaki yöntemler birkaç yaygın kullanımı göstermektedir:

Yöntem 1: Bir işlevi birden çok sütuna uygulama

 #multiply values in col1 and col2 by 2
df %>% 
  mutate(across(c(col1, col2), function (x) x*2))

Yöntem 2: Birden çok sütun için özet istatistiğini hesaplayın

 #calculate mean of col1 and col2
df %>%
  summarise(across(c(col1, col2), mean, na. rm = TRUE ))

Yöntem 3: Birden Çok Sütun için Çoklu Özet İstatistiklerini Hesaplama

 #calculate mean and standard deviation for col1 and col2
df %>%
  summarise(across(c(col1, col2), list(mean=mean, sd=sd), na. rm = TRUE ))

Aşağıdaki örnekler, her yöntemin aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
                 points=c(22, 25, 29, 13, 22, 30),
                 rebounds=c(12, 10, 6, 6, 8, 11))

#view data frame
df

  conf points rebounds
1 East 22 12
2 East 25 10
3 East 29 6
4 West 13 6
5 West 22 8
6 West 30 11

Örnek 1: Bir işlevi birden çok sütuna uygulama

Aşağıdaki kod, sayı ve ribaund sütunlarındaki değerleri 2 ile çarpmak için cross() işlevinin nasıl kullanılacağını gösterir:

 library (dplyr)

#multiply values in points and rebounds columns by 2
df %>% 
  mutate(across(c(points, rebounds), function (x) x*2))

  conf points rebounds
1 East 44 24
2 East 50 20
3 East 58 12
4 West 26 12
5 West 44 16
6 West 60 22

Örnek 2: Birden çok sütun için özet istatistiğini hesaplama

Aşağıdaki kod, sayı ve ribaund sütunlarının ortalama değerini hesaplamak için cross() işlevinin nasıl kullanılacağını gösterir:

 library (dplyr)

#calculate mean value of points an rebounds columns
df %>%
  summarise(across(c(points, rebounds), mean, na. rm = TRUE ))

  rebound points
1 23.5 8.833333

Veri çerçevesindeki tüm sayısal sütunlar için otomatik olarak bir özet istatistiği hesaplamak amacıyla is.numeric işlevini de kullanabileceğimizi unutmayın:

 library (dplyr)

#calculate mean value for every numeric column in data frame
df %>%
  summarise(across(where(is. numeric ), mean, na. rm = TRUE ))

  rebound points
1 23.5 8.833333

Örnek 3: Birden çok sütun için birden çok özet istatistiği hesaplama

Aşağıdaki kod, sayı ve ribaund sütunlarının ortalamasını ve standart sapmasını hesaplamak için cross() işlevinin nasıl kullanılacağını gösterir:

 library (dplyr)

#calculate mean and standard deviation for points and rebounds columns
df %>%
  summarise(across(c(points, rebounds), list(mean=mean, sd=sd), na. rm = TRUE ))

  points_mean points_sd rebounds_mean rebounds_sd
1 23.5 6.156298 8.833333 2.562551

Not : cross() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.

Ek kaynaklar

Aşağıdaki eğitimlerde dplyr kullanılarak diğer yaygın işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Dplyr kullanarak satırlar nasıl silinir
Dplyr kullanarak satırlar nasıl düzenlenir
Dplyr kullanarak birden çok koşula göre filtreleme nasıl yapılır

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil