Pandas: so verwenden sie groupby und wertzählungen


Sie können die folgende grundlegende Syntax verwenden, um die Häufigkeit eindeutiger Werte pro Gruppe in einem Pandas-DataFrame zu zählen:

 df. groupby ([' column1 ', ' column2 ']). size (). unstack (fill_value= 0 )

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Verwendung von GroupBy und Value Counts in Pandas

Angenommen, wir haben den folgenden Pandas-DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' position ':['G', 'G', 'F', 'F', 'C', 'G', 'F', 'F', 'F', 'F'],
                   ' points ': [8, 8, 10, 10, 11, 8, 9, 10, 10, 10]})

#view DataFrame
print (df)

  team position points
0 AG 8
1 GA 8
2 AF10
3 AF 10
4 AC 11
5 BG 8
6 BF 9
7 BF 10
8 BF 10
9 BF 10

Wir können die folgende Syntax verwenden, um die Häufigkeit von Punktwerten zu zählen, gruppiert nach Team- und Positionsspalten :

 #count frequency of points values, grouped by team and position
df. groupby ([' team ',' position ',' points ']). size (). unstack (fill_value= 0 )

	points 8 9 10 11
team position				
A C 0 0 0 1
        F 0 0 2 0
        G 2 0 0 0
B F 0 1 3 0
        G 1 0 0 0

So interpretieren Sie das Ergebnis:

  • Der Wert 8 erschien 0 Mal in der Punktespalte für Spieler aus Team A und Position C.
  • Der Wert 9 erschien 0 Mal in der Punktespalte für Spieler aus Team A und Position C.
  • Der Wert 10 erschien 0 Mal in der Punktespalte für Spieler aus Team A und Position C.
  • Der Wert 11 erschien in der Punktespalte 1 Mal für Spieler aus Team A und Position C.

Und so weiter.

Wir könnten auch die folgende Syntax verwenden, um die Häufigkeit von Positionen , gruppiert nach Team, zu zählen:

 #count frequency of positions, grouped by team
df. groupby ([' team ', ' position ']). size (). unstack (fill_value= 0 )

position C F G
team			
A 1 2 2
B 0 4 1

So interpretieren Sie das Ergebnis:

  • Der Wert „C“ kam 1 Mal bei Team A vor.
  • Der Wert „F“ erschien 2 Mal bei Team A.
  • Der Wert „G“ erschien 2 Mal bei Team A.
  • Der Wert „C“ kam bei Team B 0 Mal vor.
  • Der „F“-Wert kam bei Team B viermal vor.
  • Der Wert „G“ kam 1 Mal bei Team B vor.

Und so weiter.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So führen Sie eine GroupBy-Summe in Pandas durch
So zählen Sie eindeutige Werte mit GroupBy in Pandas
So verwenden Sie Groupby und Plot in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert