Pandas : Comment regrouper des lignes dans une liste à l’aide de GroupBy
Vous pouvez utiliser les méthodes suivantes pour regrouper les lignes DataFrame dans une liste à l’aide de GroupBy dans pandas :
Méthode 1 : regrouper les lignes dans une liste pour une colonne
df.groupby('group_var')['values_var'].agg(list).reset_index(name='values_var')
Méthode 2 : regrouper les lignes dans une liste pour plusieurs colonnes
df.groupby('team').agg(list)
Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'], 'points': [10, 10, 12, 15, 19, 23, 20, 20, 26], 'assists': [6, 8, 9, 11, 13, 8, 8, 15, 10]}) #view DataFrame print(df) team points assists 0 A 10 6 1 A 10 8 2 A 12 9 3 A 15 11 4 B 19 13 5 B 23 8 6 C 20 8 7 C 20 15 8 C 26 10
Exemple 1 : regrouper les lignes dans une liste pour une colonne
Nous pouvons utiliser la syntaxe suivante pour regrouper les lignes par colonne d’équipe et produire une liste pour les valeurs de la colonne de points :
#group points values into list by team
df.groupby('team')['points'].agg(list).reset_index(name='points')
team points
0 A [10, 10, 12, 15]
1 B [19, 23]
2 C [20, 20, 26]
Nous pouvons voir qu’une liste de valeurs de points est produite pour chaque équipe unique dans le DataFrame.
Exemple 2 : regrouper les lignes dans une liste pour plusieurs colonnes
Nous pouvons utiliser la syntaxe suivante pour regrouper les lignes par colonne d’équipe et produire une liste de valeurs pour les colonnes de points et d’assistance :
#group points and assists values into lists by team
df.groupby('team').agg(list)
points assists
team
A [10, 10, 12, 15] [6, 8, 9, 11]
B [19, 23] [13, 8]
C [20, 20, 26] [8, 15, 10]
Nous pouvons voir qu’une liste de valeurs de points et une liste de valeurs de passes décisives sont produites pour chaque équipe unique dans le DataFrame.
Remarque : Vous pouvez trouver la documentation complète de l’opération GroupBy dans pandas ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Pandas : comment calculer la somme cumulée par groupe
Pandas : comment compter les valeurs uniques par groupe
Pandas : comment calculer le mode par groupe
Pandas : comment calculer la corrélation par groupe