R'de veriler aya göre gruplandırma (örnekle)


Verileri aya göre hızla gruplandırmak için R’deki lubridate paketindeki Floor_date() işlevini kullanabilirsiniz.

Bu işlev aşağıdaki temel sözdizimini kullanır:

 library (tidyverse)

df %>% 
    group_by(month = lubridate::floor_date(date_column, ' month ')) %>%
    summarize(sum = sum(value_column))

Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.

Örnek: verileri R’de aya göre gruplama

R’de bir ürünün farklı tarihlerdeki toplam satışını gösteren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (date=as. Date (c('1/4/2022', '1/9/2022', '2/10/2022', '2/15/2022',
                                '3/5/2022', '3/22/2022', '3/27/2022'), '%m/%d/%Y'),
                 sales=c(8, 14, 22, 23, 16, 17, 23))

#view data frame
df

        dirty date
1 2022-01-04 8
2 2022-01-09 14
3 2022-02-10 22
4 2022-02-15 23
5 2022-03-05 16
6 2022-03-22 17
7 2022-03-27 23

Aylara göre gruplandırılmış satışların toplamını hesaplamak için aşağıdaki kodu kullanabiliriz:

 library (tidyverse)

#group data by month and sum sales
df %>% 
    group_by(month = lubridate::floor_date(date, ' month ')) %>%
    summarize(sum_of_sales = sum(sales))

# A tibble: 3 x 2
  month sum_of_sales
              
1 2022-01-01 22
2 2022-02-01 45
3 2022-03-01 56

Sonuçtan şunu görebiliriz:

  • Ocak ayında toplam 22 adet satış gerçekleşti.
  • Şubat ayında toplam 45 adet satış gerçekleşti.
  • Mart ayında toplam 56 adet satış gerçekleşti.

Verileri başka bir metrik kullanarak da toplayabiliriz.

Örneğin, bir günde yapılan maksimum satışları aya göre gruplandırarak hesaplayabiliriz:

 library (tidyverse)

#group data by month and find max sales
df %>% 
    group_by(month = lubridate::floor_date(date, ' month ')) %>%
    summarize(max_of_sales = max(sales))

# A tibble: 3 x 2
  month max_of_sales
              
1 2022-01-01 14
2 2022-02-01 23
3 2022-03-01 23

Sonuçtan şunu görebiliriz:

  • Ocak ayında bir günde en fazla satış 14 adet gerçekleşti.
  • Şubat ayında bir günde en çok satış 23 adet gerçekleşti.
  • Mart ayında bir günde en fazla satış 23 adetle gerçekleşti.

Summary() işlevinde istediğiniz ölçümü kullanmaktan çekinmeyin.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’deki tarihten yıl nasıl çıkarılır
R’deki tarihten ay nasıl çıkarılır
R’de bir veri çerçevesi tarihe göre nasıl sıralanır
R’de faktör tarihe nasıl dönüştürülür?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir