Pandas: so berechnen sie die kumulative summe pro gruppe


Sie können die folgende Syntax verwenden, um eine kumulative Summe pro Gruppe in Pandas zu berechnen:

 df[' cumsum_col '] = df. groupby ([' col1 '])[' col2 ']. cumsum ()

Diese spezielle Formel berechnet die kumulative Summe von col2 , gruppiert nach col1 , und zeigt die Ergebnisse in einer neuen Spalte mit dem Titel cumsum_col an.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Berechnen Sie die kumulative Summe pro Gruppe in Pandas

Nehmen wir an, wir haben den folgenden Pandas-DataFrame, der Verkaufsinformationen für verschiedene Geschäfte enthält:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' sales ': [4, 7, 10, 5, 8, 9, 12, 15, 10, 8]})

#view DataFrame
print (df)

  blind sales
0 to 4
1 to 7
2 to 10
3 to 5
4 to 8
5 B 9
6 B 12
7 B 15
8 B 10
9 B 8

Wir können die folgende Syntax verwenden, um die kumulative Summe der Verkäufe für jedes Geschäft zu berechnen:

 #add column that shows cumulative sum of sales by store
df[' cumsum_sales '] = df. groupby ([' store '])[' sales ']. cumsum ()

#view updated DataFrame
print (df)

  store sales cumsum_sales
0 to 4 4
1 to 7 11
2 to 10 21
3 to 5 26
4 to 8 34
5 B 9 9
6 B 12 21
7 B 15 36
8 B 10 46
9 B 8 54

In der Spalte „cumsum_sales“ werden die kumulierten Verkäufe angezeigt, gruppiert nach den einzelnen Filialen.

Hinweis : Die vollständige Dokumentation der Cumsum- Funktion in Pandas finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So summieren Sie bestimmte Spalten in Pandas
So summieren Sie Spalten basierend auf einer Bedingung in Pandas
So berechnen Sie eine umgekehrte kumulative Summe in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert