So gruppieren sie daten nach monat in r (mit beispiel)


Sie können die Funktion floor_date() aus dem Lubridate- Paket in R verwenden, um Daten schnell nach Monat zu gruppieren.

Diese Funktion verwendet die folgende grundlegende Syntax:

 library (tidyverse)

df %>% 
    group_by(month = lubridate::floor_date(date_column, ' month ')) %>%
    summarize(sum = sum(value_column))

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel: Daten nach Monat in R gruppieren

Angenommen, wir haben den folgenden Datenrahmen in R, der die Gesamtverkäufe eines Artikels zu verschiedenen Daten anzeigt:

 #create data frame
df <- data. frame (date=as. Date (c('1/4/2022', '1/9/2022', '2/10/2022', '2/15/2022',
                                '3/5/2022', '3/22/2022', '3/27/2022'), '%m/%d/%Y'),
                 sales=c(8, 14, 22, 23, 16, 17, 23))

#view data frame
df

        dirty date
1 2022-01-04 8
2 2022-01-09 14
3 2022-02-10 22
4 2022-02-15 23
5 2022-03-05 16
6 2022-03-22 17
7 2022-03-27 23

Mit dem folgenden Code können wir die Summe der Verkäufe, gruppiert nach Monat, berechnen:

 library (tidyverse)

#group data by month and sum sales
df %>% 
    group_by(month = lubridate::floor_date(date, ' month ')) %>%
    summarize(sum_of_sales = sum(sales))

# A tibble: 3 x 2
  month sum_of_sales
              
1 2022-01-01 22
2 2022-02-01 45
3 2022-03-01 56

Aus dem Ergebnis können wir sehen:

  • Insgesamt wurden im Januar 22 Verkäufe getätigt.
  • Insgesamt wurden im Februar 45 Verkäufe getätigt.
  • Insgesamt wurden im März 56 Verkäufe getätigt.

Wir können Daten auch mithilfe einer anderen Metrik aggregieren.

Wir könnten zum Beispiel die maximalen Verkäufe an einem Tag berechnen, gruppiert nach Monat:

 library (tidyverse)

#group data by month and find max sales
df %>% 
    group_by(month = lubridate::floor_date(date, ' month ')) %>%
    summarize(max_of_sales = max(sales))

# A tibble: 3 x 2
  month max_of_sales
              
1 2022-01-01 14
2 2022-02-01 23
3 2022-03-01 23

Aus dem Ergebnis können wir sehen:

  • Die meisten Verkäufe an einem Tag im Januar betrugen 14 .
  • Die meisten Verkäufe an einem Tag im Februar betrugen 23 .
  • Die meisten Verkäufe an einem Tag im März betrugen 23 .

Fühlen Sie sich frei, jede gewünschte Metrik in der Funktion summary() zu verwenden.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So extrahieren Sie das Jahr aus dem Datum in R
So extrahieren Sie den Monat aus dem Datum in R
So sortieren Sie einen Datenrahmen nach Datum in R
So konvertieren Sie den Faktor in R in das Datum

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert