Pandas: so verwenden sie groupby mit mehreren aggregationen


Sie können die folgende grundlegende Syntax verwenden, um ein Groupby mit mehreren Aggregationen in Pandas zu verwenden:

 df. groupby (' team '). agg (
    mean_points=(' points ', np. mean ),
    sum_points=(' points ', np. sum ),
    std_points=(' points ', np. std ))

Diese spezielle Formel gruppiert die Zeilen des DataFrame nach der Variablen „ team “ und berechnet dann mehrere zusammenfassende Statistiken für die Variable „ points“ .

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Verwendung von Groupby mit mehreren Aggregationen in Pandas

Angenommen, wir haben den folgenden Pandas-DataFrame, der Informationen über verschiedene Basketballspieler enthält:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Mavs', 'Heat', 'Heat', 'Heat'],
                   ' points ': [18, 22, 19, 14, 14, 11],
                   ' assists ': [5, 7, 7, 9, 12, 9]})

#view DataFrame
print (df)

   team points assists
0 Mavs 18 5
1 Mavs 22 7
2 Mavs 19 7
3 Heat 14 9
4 Heat 14 12
5 Heat 11 9

Wir können die folgende Syntax verwenden, um die Zeilen des DataFrame nach Team zu gruppieren und dann den Durchschnitt, die Summe und die Standardabweichung der Punkte für jedes Team zu berechnen:

 import numpy as np

#group by team and calculate mean, sum, and standard deviation of points
df. groupby (' team '). agg (
    mean_points=(' points ', np. mean ),
    sum_points=(' points ', np. sum ),
    std_points=(' points ', np. std ))

      mean_points sum_points std_points
team			
Heat 13.000000 39 1.732051
Mavs 19.666667 59 2.081666

Das Ergebnis zeigt den Mittelwert, die Summe und die Standardabweichung der Punktevariablen für jedes Team an.

Sie können eine ähnliche Syntax verwenden, um eine Gruppierung durchzuführen und so viele Aggregationen zu berechnen, wie Sie möchten.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Panda-Aufgaben ausführen:

So zählen Sie eindeutige Werte mit Pandas GroupBy
So wenden Sie eine Funktion auf Pandas Groupby an
So erstellen Sie ein Balkendiagramm aus Pandas GroupBy

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert