Pandas: berechnen sie mittelwert und standard einer spalte in groupby


Sie können die folgende Syntax verwenden, um den Mittelwert und die Standardabweichung einer Spalte zu berechnen, nachdem Sie die Operation „groupby()“ in Pandas verwendet haben:

 df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})

In diesem speziellen Beispiel werden die Zeilen eines Pandas-DataFrames nach dem Wert in der Spalte „ Team “ gruppiert und dann der Mittelwert und die Standardabweichung der Werte in der Spalte „Punkte“ berechnet.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Berechnen Sie den Mittelwert und die Norm einer Spalte in Pandas Groupby

Angenommen, wir haben den folgenden Pandas-DataFrame, der Informationen über Basketballspieler verschiedener Teams enthält:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28],
                   ' assists ': [5, 5, 7, 9, 10, 14, 13, 8, 2, 7]})
                            
#view DataFrame
print (df)

  team points assists
0 to 12 5
1 to 15 5
2 To 17 7
3 To 17 9
4 B 19 10
5 B 14 14
6 B 15 13
7 C 20 8
8 C 24 2
9 C 28 7

Wir können die folgende Syntax verwenden, um den Mittelwert und die Standardabweichung der Werte in der Punktespalte , gruppiert nach der Teamspalte , zu berechnen:

 #calculate mean and standard deviation of points, grouped by team
output = df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})

#view results
print (output)

  team points          
         mean std
0 A 15.25 2.362908
1 B 16.00 2.645751
2 C 24.00 4.000000

Aus dem Ergebnis können wir sehen:

  • Der durchschnittliche Punktwert von Team A beträgt 15,25 .
  • Die Standardabweichung der Punkte von Team A beträgt 2,362908 .

Und so weiter.

Wir können die Spalten auch umbenennen, damit das Ergebnis besser lesbar ist:

 #rename columns
output.output. columns = [' team ', ' points_mean ', ' points_std ']

#view updated results
print (output)

  team points_mean points_std
0 A 15.25 2.362908
1 B 16.00 2.645751
2 C 24.00 4.000000

Hinweis : Die vollständige Dokumentation der Pandas- Groupby() -Operation finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So führen Sie eine GroupBy-Summe in Pandas durch
So verwenden Sie Groupby und Plot in Pandas
So zählen Sie eindeutige Werte mit GroupBy in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert