Dplyr: veriler nasıl özetlenir ancak tüm sütunlar nasıl tutulur?


dplyr’da summarise() işlevini kullanırken, summarise() veya group_by() işlevlerine dahil olmayan tüm değişkenler otomatik olarak kaldırılacaktır.

Ancak, veri çerçevesindeki tüm sütunları korurken verileri özetlemek için mutate() işlevini kullanabilirsiniz.

Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.

Örnek: Verileri özetleyin ancak tüm sütunları dplyr kullanarak saklayın

Çeşitli basketbol oyuncuları hakkında bilgi içeren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 3 ),
                 points=c(4, 9, 8, 12, 15, 14, 29, 30, 22),
                 assists=c(3, 3, 2, 5, 8, 10, 4, 5, 12))

#view data frame
df

  team points assists
1 to 4 3
2 to 9 3
3 to 8 2
4 B 12 5
5 B 15 8
6 B 14 10
7 C 29 4
8 C 30 5
9 C 22 12

Takım başına alınan ortalama puanları özetlemek için aşağıdaki sözdizimini kullanabiliriz:

 library (dplyr)

#summarize mean points values by team
df %>%
  group_by(team) %>%
  summarize(mean_pts = mean(points))

# A tibble: 3 x 2
  team mean_pts
      
1 to 7  
2 B 13.7
3 C 27

Mean_pts adı verilen sütun, her takımın aldığı ortalama puanı gösterir.

Sonuçtan şunları görebiliriz:

  • A takımı oyuncularının aldığı ortalama sayı 7’dir .
  • B takımı oyuncularının aldığı ortalama sayı 13,7’dir .
  • C takımı oyuncularının aldığı ortalama sayı 27’dir .

Ancak, diğer tüm sütunları orijinal veri çerçevesinden korumak istediğimizi varsayalım.

Bunu yapmak için mutate() işleviyle birlikte aşağıdaki sözdizimini kullanabiliriz:

 library (dplyr)

#summarize mean points values by team and keep all columns
df %>%
  group_by(team) %>%
  mutate(mean_pts = mean(points)) %>%
  A group()

# A tibble: 9 x 4
  team points assists mean_pts
           
1 to 4 3 7  
2 to 9 3 7  
3 to 8 2 7  
4 B 12 5 13.7
5 B 15 8 13.7
6 B 14 10 13.7
7 C 29 4 27  
8 C 30 5 27  
9 C 22 12 27

Mutate() işlevini kullanarak, orijinal veri çerçevesindeki diğer tüm sütunları korurken, takım başına kazanılan ortalama puanları özetleyen Mean_pts adında yeni bir sütun oluşturabiliriz.

Ek kaynaklar

Aşağıdaki eğitimlerde dplyr’de diğer genel görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

dplyr: Sütun bir dize içeriyorsa bir değişken nasıl değiştirilir?
dplyr: Mutate() kullanılarak faktör düzeyleri nasıl değiştirilir?
dplyr: Birden fazla sütuna nasıl eklenir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir