Pandas: so gruppieren sie zeilen in einer liste mithilfe von groupby
Sie können die folgenden Methoden verwenden, um DataFrame-Zeilen mithilfe von GroupBy in Pandas in einer Liste zu gruppieren:
Methode 1: Gruppieren Sie Zeilen in einer Liste für eine Spalte
df. groupby (' group_var ')[' values_var ']. agg ( list ). reset_index (name=' values_var ')
Methode 2: Gruppieren Sie Zeilen in einer Liste für mehrere Spalten
df. groupby (' team '). agg (list)
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'], ' points ': [10, 10, 12, 15, 19, 23, 20, 20, 26], ' assists ': [6, 8, 9, 11, 13, 8, 8, 15, 10]}) #view DataFrame print (df) team points assists 0 to 10 6 1 to 10 8 2 to 12 9 3 to 15 11 4 B 19 13 5 B 23 8 6 C 20 8 7 C 20 15 8 C 26 10
Beispiel 1: Gruppieren Sie Zeilen in einer Liste für eine Spalte
Wir können die folgende Syntax verwenden, um die Zeilen nach Teamspalte zu gruppieren und eine Liste für die Punktespaltenwerte zu erstellen:
#group points values into list by team
df. groupby (' team ')[' points ']. agg ( list ). reset_index (name=' points ')
team points
0 A [10, 10, 12, 15]
1 B [19, 23]
2 C [20, 20, 26]
Wir können sehen, dass für jedes einzelne Team im DataFrame eine Liste mit Punktwerten erstellt wird.
Beispiel 2: Gruppieren Sie Zeilen in einer Liste für mehrere Spalten
Wir können die folgende Syntax verwenden, um Zeilen nach Teamspalte zu gruppieren und eine Werteliste für die Punkte- und Unterstützungsspalten zu erstellen:
#group points and assists values into lists by team
df. groupby (' team '). agg ( list )
assist points
team
A [10, 10, 12, 15] [6, 8, 9, 11]
B [19, 23] [13, 8]
C [20, 20, 26] [8, 15, 10]
Wir können sehen, dass für jedes einzelne Team im DataFrame eine Liste mit Punktwerten und eine Liste mit Unterstützungswerten erstellt wird.
Hinweis : Die vollständige Dokumentation der GroupBy-Operation in Pandas finden Sie hier .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
Pandas: So berechnen Sie die kumulative Summe pro Gruppe
Pandas: So zählen Sie eindeutige Werte nach Gruppen
Pandas: So berechnen Sie den Modus nach Gruppe
Pandas: So berechnen Sie die Korrelation nach Gruppen