R'de hızlı bir şekilde özet tablolar nasıl oluşturulur
Excel’de pivot tablolar , verileri gruplandırmanın ve özetlemenin kolay bir yolunu sağlar.
Örneğin, Excel’de aşağıdaki veri kümesine sahipsek toplam satışları bölgeye göre hızlı bir şekilde özetlemek için bir pivot tablo kullanabiliriz:
Bu bize şunu söylüyor:
- A Bölgesinde toplam 51 satış gerçekleşti
- B Bölgesinde toplam 85 satış gerçekleşti
- C Bölgesi toplam 140 satış gerçekleştirdi
Veya bölgeye göre ortalama satışlar gibi başka bir ölçümle özetleyebiliriz:
Dplyr paketindeki group_by() ve Summary() işlevlerini kullanarak R’de benzer pivot tabloları hızlı bir şekilde oluşturabildiğimiz ortaya çıktı.
Bu eğitimde bunun nasıl yapılacağına dair birkaç örnek sunulmaktadır.
Örnek: R’de PivotTable’lar oluşturma
Öncelikle Excel’den önceki örneklerde kullandığımız veri kümesinin aynısını R’de oluşturalım:
#create data frame df <- data. frame (region=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C'), device=c('X', 'X', 'Y', 'X', 'Y', 'Y', 'X', 'X', 'Y', 'Y'), sales=c(12, 18, 21, 22, 34, 29, 38, 36, 34, 32)) #view data frame df region device sales 1AX 12 2AX18 3 AY 21 4 BX22 5 BY 34 6 BY 29 7 CX 38 8CX36 9 CY 34 10 CY 32
Daha sonra dplyr paketini yükleyelim ve bölgeye göre gruplamak ve bölgeye göre satışların toplamını bulmak için group_by() ve Summary() işlevlerini kullanalım:
library (dplyr) #find sum of sales by region df %>% group_by (region) %>% summarize (sum_sales = sum (sales)) # A tibble: 3 x 2 region sum_sales 1 to 51 2 B 85 3 C 140
Bu sayıların Excel giriş örneğinde gösterilen sayılarla eşleştiğini görebiliriz.
Bölgelere göre ortalama satışları da hesaplayabiliriz:
#find average sales by region df %>% group_by (region) %>% summarize (mean_sales = mean (sales)) # A tibble: 3 x 2 region mean_sales 1 to 17 2 B 28.3 3 C 35
Yine bu sayılar önceki Excel örneğinde gösterilen sayılarla eşleşir.
Birden fazla değişkene göre de gruplandırabileceğimizi unutmayın. Örneğin, bölgeye ve cihaz türüne göre gruplandırılmış satışların toplamını bulabiliriz:
#find sum of sales by region and device type df %>% group_by (region, device) %>% summarize (sum_sales = sum (sales)) # A tibble: 6 x 3 # Groups: region [3] region device sum_sales 1AX30 2 AY 21 3 BX22 4 BY 63 5 CX 74 6 CY 66
Ek kaynaklar
R’de DÜŞEYARA (Excel’e benzer) nasıl yapılır
Tam Kılavuz: R’de Veriler Nasıl Gruplandırılır ve Özetlenir