R'de hızlı bir şekilde özet tablolar nasıl oluşturulur


Excel’de pivot tablolar , verileri gruplandırmanın ve özetlemenin kolay bir yolunu sağlar.

Örneğin, Excel’de aşağıdaki veri kümesine sahipsek toplam satışları bölgeye göre hızlı bir şekilde özetlemek için bir pivot tablo kullanabiliriz:

Bu bize şunu söylüyor:

  • A Bölgesinde toplam 51 satış gerçekleşti
  • B Bölgesinde toplam 85 satış gerçekleşti
  • C Bölgesi toplam 140 satış gerçekleştirdi

Veya bölgeye göre ortalama satışlar gibi başka bir ölçümle özetleyebiliriz:

Dplyr paketindeki group_by() ve Summary() işlevlerini kullanarak R’de benzer pivot tabloları hızlı bir şekilde oluşturabildiğimiz ortaya çıktı.

Bu eğitimde bunun nasıl yapılacağına dair birkaç örnek sunulmaktadır.

Örnek: R’de PivotTable’lar oluşturma

Öncelikle Excel’den önceki örneklerde kullandığımız veri kümesinin aynısını R’de oluşturalım:

 #create data frame
df <- data. frame (region=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C'),
                 device=c('X', 'X', 'Y', 'X', 'Y', 'Y', 'X', 'X', 'Y', 'Y'),
                 sales=c(12, 18, 21, 22, 34, 29, 38, 36, 34, 32))

#view data frame
df

   region device sales
1AX 12
2AX18
3 AY 21
4 BX22
5 BY 34
6 BY 29
7 CX 38
8CX36
9 CY 34
10 CY 32

Daha sonra dplyr paketini yükleyelim ve bölgeye göre gruplamak ve bölgeye göre satışların toplamını bulmak için group_by() ve Summary() işlevlerini kullanalım:

 library (dplyr)

#find sum of sales by region
df %>%
  group_by (region) %>% 
  summarize (sum_sales = sum (sales))

# A tibble: 3 x 2
  region sum_sales
        
1 to 51
2 B 85
3 C 140

Bu sayıların Excel giriş örneğinde gösterilen sayılarla eşleştiğini görebiliriz.

Bölgelere göre ortalama satışları da hesaplayabiliriz:

 #find average sales by region
df %>%
  group_by (region) %>% 
  summarize (mean_sales = mean (sales))

# A tibble: 3 x 2
  region mean_sales
        
1 to 17  
2 B 28.3
3 C 35

Yine bu sayılar önceki Excel örneğinde gösterilen sayılarla eşleşir.

Birden fazla değişkene göre de gruplandırabileceğimizi unutmayın. Örneğin, bölgeye ve cihaz türüne göre gruplandırılmış satışların toplamını bulabiliriz:

 #find sum of sales by region and device type
df %>%
  group_by (region, device) %>% 
  summarize (sum_sales = sum (sales))

# A tibble: 6 x 3
# Groups: region [3]
  region device sum_sales
          
1AX30
2 AY 21
3 BX22
4 BY 63
5 CX 74
6 CY 66

Ek kaynaklar

R’de DÜŞEYARA (Excel’e benzer) nasıl yapılır
Tam Kılavuz: R’de Veriler Nasıl Gruplandırılır ve Özetlenir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir