So berechnen sie den gruppendurchschnitt bei pandas (mit beispielen)


Sie können die folgenden Methoden verwenden, um den Durchschnittswert pro Gruppe unter Pandas zu berechnen:

Methode 1: Berechnen Sie den Durchschnitt einer Spalte, gruppiert nach einer Spalte

 df. groupby ([' group_col '])[' value_col ']. mean ()

Methode 2: Berechnen Sie den Durchschnitt mehrerer Spalten, gruppiert nach einer einzelnen Spalte

 df. groupby ([' group_col '])[' value_col1 ', ' value_col2 ']. mean ()

Methode 3: Berechnen Sie den Durchschnitt einer nach mehreren Spalten gruppierten Spalte

 df. groupby ([' group_col1 ', ' group_col2 '])[' value_col ']. mean ()

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'F', 'F', 'G', 'F', 'F', 'G', 'G'],
                   ' points ': [30, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [4, 3, 7, 7, 12, 15, 8, 4]})

#view DataFrame
print (df)

  team position points assists
0 AG 30 4
1 AF 22 3
2 FY 19 7
3 AG 14 7
4 BF 14 12
5 BF 11 15
6 BG 20 8
7 BG 28 4

Beispiel 1: Berechnen Sie den Durchschnitt einer Spalte, gruppiert nach einer Spalte

Der folgende Code zeigt, wie der Durchschnittswert der Punktespalte , gruppiert nach Teamspalte , berechnet wird:

 #calculate mean of points grouped by team
df. groupby (' team ')[' points ']. mean ()

team
At 9:25 p.m.
B 18.25
Name: points, dtype: float64

Aus dem Ergebnis können wir sehen:

  • Der durchschnittliche Punktwert von Team A beträgt 21,25 .
  • Der durchschnittliche Punktwert von Team B beträgt 18,25 .

Beispiel 2: Berechnen Sie den Durchschnitt mehrerer Spalten, gruppiert nach einer einzelnen Spalte

Der folgende Code zeigt, wie der Durchschnittswert der Punktespalte und der Durchschnittswert der Assists -Spalte, gruppiert nach der Teamspalte , berechnet werden:

 #calculate mean of points and mean of assists grouped by team
df. groupby (' team ')[[' points ', ' assists ']]. mean ()

       assist points
team		
At 21.25 5.25
B 18.25 9.75

Die Ausgabe zeigt den durchschnittlichen Punktwert und den durchschnittlichen Unterstützungswert für jedes Team an.

Beispiel 3: Berechnen Sie den Durchschnitt einer durch mehrere Spalten gruppierten Spalte

Der folgende Code zeigt, wie der Durchschnittswert der Punktespalte , gruppiert nach Team- und Positionsspalten , berechnet wird:

 #calculate mean of points, grouped by team and position
df. groupby ([' team ', ' position '])[' points ']. mean ()

team position
FY 20.5
      G 22.0
BF 12.5
      G 24.0
Name: points, dtype: float64

Aus dem Ergebnis können wir sehen:

  • Der durchschnittliche Punktwert der Spieler von Team A und Position F beträgt 20,5 .
  • Der durchschnittliche Punktewert für Spieler aus Team A und Position G beträgt 22 .
  • Der durchschnittliche Punktwert der Spieler von Team B und Position F beträgt 12,5 .
  • Der durchschnittliche Punktewert für Spieler aus Team B und Position G beträgt 24 .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere allgemeine Funktionen in Pandas ausgeführt werden:

So finden Sie den Maximalwert pro Gruppe bei Pandas
So ermitteln Sie die Summe pro Gruppe in Pandas
So berechnen Sie Quantile nach Gruppe in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert