Pandas: so erhalten sie die ersten n zeilen nach gruppe
Sie können die folgende grundlegende Syntax verwenden, um die ersten N Zeilen nach Gruppe in einem Pandas-DataFrame abzurufen:
df. groupby (' group_column '). head ( 2 ). reset_index (drop= True )
Diese spezielle Syntax gibt die ersten beiden Zeilen pro Gruppe zurück.
Ändern Sie einfach den Wert in der Funktion head() , um eine andere Anzahl oberer Zeilen zurückzugeben.
Die folgenden Beispiele zeigen, wie diese Syntax mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'G', 'F', 'F', 'G', 'G', 'F', 'F', 'F'], ' points ': [5, 7, 7, 9, 12, 9, 9, 4, 7, 7]}) #view DataFrame print (df) team position points 0 AG 5 1 AG 7 2 AG 7 3 AF 9 4AF 12 5 BG 9 6 BG 9 7 BF 4 8 BF 7 9 BF 7
Beispiel 1: Erhalten Sie die ersten N Zeilen, gruppiert nach einer Spalte
Der folgende Code zeigt, wie die ersten beiden Zeilen, gruppiert nach der Teamvariablen , zurückgegeben werden:
#get top 2 rows grouped by team
df. groupby (' team '). head ( 2 ). reset_index (drop= True )
team position points
0 A G 5
1 A G 7
2 B G 9
3 B G 9
Die Ausgabe zeigt die ersten beiden Zeilen, gruppiert nach Teamvariablen .
Beispiel 2: Erhalten Sie die ersten N Zeilen, gruppiert nach mehreren Spalten
Der folgende Code zeigt, wie die ersten beiden Zeilen, gruppiert nach Team- und Positionsvariablen , zurückgegeben werden:
#get top 2 rows grouped by team and position
df. groupby ([' team ', ' position ']). head ( 2 ). reset_index (drop= True )
team position points
0 A G 5
1 A G 7
2 A F 9
3 A F 12
4 B G 9
5 B G 9
6 B F 4
7 B F 7
Die Ausgabe zeigt die ersten beiden Zeilen, gruppiert nach Team- und Positionsvariablen .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
Pandas: So finden Sie eindeutige Werte in einer Spalte
Pandas: So finden Sie eindeutige Werte in mehreren Spalten
Pandas: So zählen Sie Vorkommen eines bestimmten Werts in einer Spalte