So gruppieren sie nach quartalen in pandas dataframe (mit beispiel)


Sie können die folgende grundlegende Syntax verwenden, um Zeilen in einem Pandas-DataFrame nach Viertel zu gruppieren:

 #convert date column to datetime
df[' date '] = pd. to_datetime (df[' date '])

#calculate sum of values, grouped by quarter
df. groupby (df[' date ']. dt . to_period (' Q '))[' values ']. sum ()

Diese spezielle Formel gruppiert die Zeilen in der Datumsspalte nach Viertel und berechnet die Summe der Wertespalte im DataFrame.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: So gruppieren Sie in Pandas nach Vierteln

Nehmen wir an, wir haben den folgenden Pandas-DataFrame, der die Verkäufe eines Unternehmens zu verschiedenen Daten anzeigt:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' date ': pd. date_range (start='1/1/2022', freq='M', periods= 12 ),
                   ' sales ': [6, 8, 10, 5, 4, 8, 8, 3, 5, 14, 8, 3]})

#view DataFrame
print (df)

         dirty date
0 2022-01-31 6
1 2022-02-28 8
2 2022-03-31 10
3 2022-04-30 5
4 2022-05-31 4
5 2022-06-30 8
6 2022-07-31 8
7 2022-08-31 3
8 2022-09-30 5
9 2022-10-31 14
10 2022-11-30 8
11 2022-12-31 3

Verwandte Themen: So erstellen Sie einen Datumsbereich in Pandas

Die folgende Syntax kann verwendet werden, um die Summe der nach Quartalen gruppierten Verkäufe zu berechnen:

 #convert date column to datetime and subtract one week
df[' date '] = pd. to_datetime (df[' date '])

#calculate sum of sales, grouped by quarter
df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. sum ()

date
2022Q1 24
2022Q2 17
2022Q3 16
2022Q4 25
Freq: Q-DEC, Name: sales, dtype: int64

So interpretieren Sie das Ergebnis:

  • Im ersten Quartal wurden insgesamt 24 Verkäufe getätigt.
  • Im zweiten Quartal wurden insgesamt 17 Verkäufe getätigt.
  • Im dritten Quartal wurden insgesamt 16 Verkäufe getätigt.
  • Im vierten Quartal wurden insgesamt 25 Verkäufe getätigt.

Wir können eine ähnliche Syntax verwenden, um eine andere Metrik zu berechnen, gruppiert nach Quartal.

Beispielsweise könnten wir stattdessen den maximalen Verkaufswert, gruppiert nach Quartal, berechnen:

 #convert date column to datetime
df[' date '] = pd. to_datetime (df[' date '])

#calculate max of sales, grouped by quarter
df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. max ()

date
2022Q1 10
2022Q2 8
2022Q3 8
2022Q4 14
Freq: Q-DEC, Name: sales, dtype: int64

So interpretieren Sie das Ergebnis:

  • Der Spitzenumsatz in einem einzelnen Monat im ersten Quartal betrug 10 .
  • Der Spitzenumsatz in einem einzelnen Monat im zweiten Quartal betrug 8 .
  • Der Spitzenumsatz in einem einzelnen Monat im dritten Quartal betrug 8 .
  • Der Spitzenumsatz in einem einzelnen Monat im vierten Quartal betrug 14 .

Hinweis : Die vollständige Dokumentation der Groupby- Operation in Pandas finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So gruppieren Sie nach Monat in Pandas DataFrame
So gruppieren Sie nach Woche in Pandas DataFrame
Pandas: Wie man Groupby verwendet und bedingt zählt

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert