Cara mengelompokkan data berdasarkan bulan di r (dengan contoh)


Anda dapat menggunakan fungsi floor_date() dari paket lubridate di R untuk mengelompokkan data berdasarkan bulan dengan cepat.

Fungsi ini menggunakan sintaks dasar berikut:

 library (tidyverse)

df %>% 
    group_by(month = lubridate::floor_date(date_column, ' month ')) %>%
    summarize(sum = sum(value_column))

Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.

Contoh: mengelompokkan data berdasarkan bulan di R

Misalkan kita memiliki bingkai data berikut di R yang menunjukkan total penjualan suatu barang pada tanggal berbeda:

 #create data frame
df <- data. frame (date=as. Date (c('1/4/2022', '1/9/2022', '2/10/2022', '2/15/2022',
                                '3/5/2022', '3/22/2022', '3/27/2022'), '%m/%d/%Y'),
                 sales=c(8, 14, 22, 23, 16, 17, 23))

#view data frame
df

        dirty date
1 2022-01-04 8
2 2022-01-09 14
3 2022-02-10 22
4 2022-02-15 23
5 2022-03-05 16
6 2022-03-22 17
7 2022-03-27 23

Kita dapat menggunakan kode berikut untuk menghitung jumlah penjualan, yang dikelompokkan berdasarkan bulan:

 library (tidyverse)

#group data by month and sum sales
df %>% 
    group_by(month = lubridate::floor_date(date, ' month ')) %>%
    summarize(sum_of_sales = sum(sales))

# A tibble: 3 x 2
  month sum_of_sales
              
1 2022-01-01 22
2 2022-02-01 45
3 2022-03-01 56

Dari hasilnya kita dapat melihat:

  • Secara total, 22 penjualan dilakukan pada bulan Januari.
  • Secara total, 45 penjualan dilakukan pada bulan Februari.
  • Secara total, 56 penjualan dilakukan pada bulan Maret.

Kami juga dapat menggabungkan data menggunakan metrik lain.

Misalnya, kita dapat menghitung penjualan maksimum yang dihasilkan dalam sehari, dikelompokkan berdasarkan bulan:

 library (tidyverse)

#group data by month and find max sales
df %>% 
    group_by(month = lubridate::floor_date(date, ' month ')) %>%
    summarize(max_of_sales = max(sales))

# A tibble: 3 x 2
  month max_of_sales
              
1 2022-01-01 14
2 2022-02-01 23
3 2022-03-01 23

Dari hasilnya kita dapat melihat:

  • Penjualan terbanyak yang dilakukan dalam satu hari di bulan Januari adalah 14 .
  • Penjualan terbanyak yang dilakukan dalam satu hari di bulan Februari adalah 23 .
  • Penjualan terbanyak yang dilakukan dalam satu hari di bulan Maret adalah 23 .

Jangan ragu untuk menggunakan metrik apa pun yang Anda inginkan dalam fungsi ringkasan() .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara mengekstrak tahun dari tanggal di R
Cara mengekstrak bulan dari tanggal di R
Cara mengurutkan bingkai data berdasarkan tanggal di R
Bagaimana mengkonversi faktor ke tanggal di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *