So gruppieren sie nach quartalen in pandas dataframe (mit beispiel)
Sie können die folgende grundlegende Syntax verwenden, um Zeilen in einem Pandas-DataFrame nach Viertel zu gruppieren:
#convert date column to datetime df[' date '] = pd. to_datetime (df[' date ']) #calculate sum of values, grouped by quarter df. groupby (df[' date ']. dt . to_period (' Q '))[' values ']. sum ()
Diese spezielle Formel gruppiert die Zeilen in der Datumsspalte nach Viertel und berechnet die Summe der Wertespalte im DataFrame.
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: So gruppieren Sie in Pandas nach Vierteln
Nehmen wir an, wir haben den folgenden Pandas-DataFrame, der die Verkäufe eines Unternehmens zu verschiedenen Daten anzeigt:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' date ': pd. date_range (start='1/1/2022', freq='M', periods= 12 ),
' sales ': [6, 8, 10, 5, 4, 8, 8, 3, 5, 14, 8, 3]})
#view DataFrame
print (df)
dirty date
0 2022-01-31 6
1 2022-02-28 8
2 2022-03-31 10
3 2022-04-30 5
4 2022-05-31 4
5 2022-06-30 8
6 2022-07-31 8
7 2022-08-31 3
8 2022-09-30 5
9 2022-10-31 14
10 2022-11-30 8
11 2022-12-31 3
Verwandte Themen: So erstellen Sie einen Datumsbereich in Pandas
Die folgende Syntax kann verwendet werden, um die Summe der nach Quartalen gruppierten Verkäufe zu berechnen:
#convert date column to datetime and subtract one week df[' date '] = pd. to_datetime (df[' date ']) #calculate sum of sales, grouped by quarter df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. sum () date 2022Q1 24 2022Q2 17 2022Q3 16 2022Q4 25 Freq: Q-DEC, Name: sales, dtype: int64
So interpretieren Sie das Ergebnis:
- Im ersten Quartal wurden insgesamt 24 Verkäufe getätigt.
- Im zweiten Quartal wurden insgesamt 17 Verkäufe getätigt.
- Im dritten Quartal wurden insgesamt 16 Verkäufe getätigt.
- Im vierten Quartal wurden insgesamt 25 Verkäufe getätigt.
Wir können eine ähnliche Syntax verwenden, um eine andere Metrik zu berechnen, gruppiert nach Quartal.
Beispielsweise könnten wir stattdessen den maximalen Verkaufswert, gruppiert nach Quartal, berechnen:
#convert date column to datetime df[' date '] = pd. to_datetime (df[' date ']) #calculate max of sales, grouped by quarter df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. max () date 2022Q1 10 2022Q2 8 2022Q3 8 2022Q4 14 Freq: Q-DEC, Name: sales, dtype: int64
So interpretieren Sie das Ergebnis:
- Der Spitzenumsatz in einem einzelnen Monat im ersten Quartal betrug 10 .
- Der Spitzenumsatz in einem einzelnen Monat im zweiten Quartal betrug 8 .
- Der Spitzenumsatz in einem einzelnen Monat im dritten Quartal betrug 8 .
- Der Spitzenumsatz in einem einzelnen Monat im vierten Quartal betrug 14 .
Hinweis : Die vollständige Dokumentation der Groupby- Operation in Pandas finden Sie hier .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So gruppieren Sie nach Monat in Pandas DataFrame
So gruppieren Sie nach Woche in Pandas DataFrame
Pandas: Wie man Groupby verwendet und bedingt zählt