Dplyr: veriler nasıl özetlenir ancak tüm sütunlar nasıl tutulur?
dplyr’da summarise() işlevini kullanırken, summarise() veya group_by() işlevlerine dahil olmayan tüm değişkenler otomatik olarak kaldırılacaktır.
Ancak, veri çerçevesindeki tüm sütunları korurken verileri özetlemek için mutate() işlevini kullanabilirsiniz.
Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.
Örnek: Verileri özetleyin ancak tüm sütunları dplyr kullanarak saklayın
Çeşitli basketbol oyuncuları hakkında bilgi içeren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:
#create data frame df <- data. frame (team=rep(c(' A ', ' B ', ' C '), each= 3 ), points=c(4, 9, 8, 12, 15, 14, 29, 30, 22), assists=c(3, 3, 2, 5, 8, 10, 4, 5, 12)) #view data frame df team points assists 1 to 4 3 2 to 9 3 3 to 8 2 4 B 12 5 5 B 15 8 6 B 14 10 7 C 29 4 8 C 30 5 9 C 22 12
Takım başına alınan ortalama puanları özetlemek için aşağıdaki sözdizimini kullanabiliriz:
library (dplyr) #summarize mean points values by team df %>% group_by(team) %>% summarize(mean_pts = mean(points)) # A tibble: 3 x 2 team mean_pts 1 to 7 2 B 13.7 3 C 27
Mean_pts adı verilen sütun, her takımın aldığı ortalama puanı gösterir.
Sonuçtan şunları görebiliriz:
- A takımı oyuncularının aldığı ortalama sayı 7’dir .
- B takımı oyuncularının aldığı ortalama sayı 13,7’dir .
- C takımı oyuncularının aldığı ortalama sayı 27’dir .
Ancak, diğer tüm sütunları orijinal veri çerçevesinden korumak istediğimizi varsayalım.
Bunu yapmak için mutate() işleviyle birlikte aşağıdaki sözdizimini kullanabiliriz:
library (dplyr) #summarize mean points values by team and keep all columns df %>% group_by(team) %>% mutate(mean_pts = mean(points)) %>% A group() # A tibble: 9 x 4 team points assists mean_pts 1 to 4 3 7 2 to 9 3 7 3 to 8 2 7 4 B 12 5 13.7 5 B 15 8 13.7 6 B 14 10 13.7 7 C 29 4 27 8 C 30 5 27 9 C 22 12 27
Mutate() işlevini kullanarak, orijinal veri çerçevesindeki diğer tüm sütunları korurken, takım başına kazanılan ortalama puanları özetleyen Mean_pts adında yeni bir sütun oluşturabiliriz.
Ek kaynaklar
Aşağıdaki eğitimlerde dplyr’de diğer genel görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
dplyr: Sütun bir dize içeriyorsa bir değişken nasıl değiştirilir?
dplyr: Mutate() kullanılarak faktör düzeyleri nasıl değiştirilir?
dplyr: Birden fazla sütuna nasıl eklenir