Pandas: berechnen sie mittelwert und standard einer spalte in groupby
Sie können die folgende Syntax verwenden, um den Mittelwert und die Standardabweichung einer Spalte zu berechnen, nachdem Sie die Operation „groupby()“ in Pandas verwendet haben:
df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})
In diesem speziellen Beispiel werden die Zeilen eines Pandas-DataFrames nach dem Wert in der Spalte „ Team “ gruppiert und dann der Mittelwert und die Standardabweichung der Werte in der Spalte „Punkte“ berechnet.
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Berechnen Sie den Mittelwert und die Norm einer Spalte in Pandas Groupby
Angenommen, wir haben den folgenden Pandas-DataFrame, der Informationen über Basketballspieler verschiedener Teams enthält:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'], ' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28], ' assists ': [5, 5, 7, 9, 10, 14, 13, 8, 2, 7]}) #view DataFrame print (df) team points assists 0 to 12 5 1 to 15 5 2 To 17 7 3 To 17 9 4 B 19 10 5 B 14 14 6 B 15 13 7 C 20 8 8 C 24 2 9 C 28 7
Wir können die folgende Syntax verwenden, um den Mittelwert und die Standardabweichung der Werte in der Punktespalte , gruppiert nach der Teamspalte , zu berechnen:
#calculate mean and standard deviation of points, grouped by team output = df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']}) #view results print (output) team points mean std 0 A 15.25 2.362908 1 B 16.00 2.645751 2 C 24.00 4.000000
Aus dem Ergebnis können wir sehen:
- Der durchschnittliche Punktwert von Team A beträgt 15,25 .
- Die Standardabweichung der Punkte von Team A beträgt 2,362908 .
Und so weiter.
Wir können die Spalten auch umbenennen, damit das Ergebnis besser lesbar ist:
#rename columns output.output. columns = [' team ', ' points_mean ', ' points_std '] #view updated results print (output) team points_mean points_std 0 A 15.25 2.362908 1 B 16.00 2.645751 2 C 24.00 4.000000
Hinweis : Die vollständige Dokumentation der Pandas- Groupby() -Operation finden Sie hier .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So führen Sie eine GroupBy-Summe in Pandas durch
So verwenden Sie Groupby und Plot in Pandas
So zählen Sie eindeutige Werte mit GroupBy in Pandas