Pandas: so verwenden sie groupby mit mehreren aggregationen
Sie können die folgende grundlegende Syntax verwenden, um ein Groupby mit mehreren Aggregationen in Pandas zu verwenden:
df. groupby (' team '). agg ( mean_points=(' points ', np. mean ), sum_points=(' points ', np. sum ), std_points=(' points ', np. std ))
Diese spezielle Formel gruppiert die Zeilen des DataFrame nach der Variablen „ team “ und berechnet dann mehrere zusammenfassende Statistiken für die Variable „ points“ .
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Verwendung von Groupby mit mehreren Aggregationen in Pandas
Angenommen, wir haben den folgenden Pandas-DataFrame, der Informationen über verschiedene Basketballspieler enthält:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat'], ' points ': [18, 22, 19, 14, 14, 11], ' assists ': [5, 7, 7, 9, 12, 9]}) #view DataFrame print (df) team points assists 0 Mavs 18 5 1 Mavs 22 7 2 Mavs 19 7 3 Heat 14 9 4 Heat 14 12 5 Heat 11 9
Wir können die folgende Syntax verwenden, um die Zeilen des DataFrame nach Team zu gruppieren und dann den Durchschnitt, die Summe und die Standardabweichung der Punkte für jedes Team zu berechnen:
import numpy as np #group by team and calculate mean, sum, and standard deviation of points df. groupby (' team '). agg ( mean_points=(' points ', np. mean ), sum_points=(' points ', np. sum ), std_points=(' points ', np. std )) mean_points sum_points std_points team Heat 13.000000 39 1.732051 Mavs 19.666667 59 2.081666
Das Ergebnis zeigt den Mittelwert, die Summe und die Standardabweichung der Punktevariablen für jedes Team an.
Sie können eine ähnliche Syntax verwenden, um eine Gruppierung durchzuführen und so viele Aggregationen zu berechnen, wie Sie möchten.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Panda-Aufgaben ausführen:
So zählen Sie eindeutige Werte mit Pandas GroupBy
So wenden Sie eine Funktion auf Pandas Groupby an
So erstellen Sie ein Balkendiagramm aus Pandas GroupBy