Pandas : Comment regrouper des lignes dans une liste à l’aide de GroupBy



Vous pouvez utiliser les méthodes suivantes pour regrouper les lignes DataFrame dans une liste à l’aide de GroupBy dans pandas :

Méthode 1 : regrouper les lignes dans une liste pour une colonne

df.groupby('group_var')['values_var'].agg(list).reset_index(name='values_var')

Méthode 2 : regrouper les lignes dans une liste pour plusieurs colonnes

df.groupby('team').agg(list)

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
                   'points': [10, 10, 12, 15, 19, 23, 20, 20, 26],
                   'assists': [6, 8, 9, 11, 13, 8, 8, 15, 10]})

#view DataFrame
print(df)

  team  points  assists
0    A      10        6
1    A      10        8
2    A      12        9
3    A      15       11
4    B      19       13
5    B      23        8
6    C      20        8
7    C      20       15
8    C      26       10

Exemple 1 : regrouper les lignes dans une liste pour une colonne

Nous pouvons utiliser la syntaxe suivante pour regrouper les lignes par colonne d’équipe et produire une liste pour les valeurs de la colonne de points :

#group points values into list by team
df.groupby('team')['points'].agg(list).reset_index(name='points')

     team	points
0	A	[10, 10, 12, 15]
1	B	[19, 23]
2	C	[20, 20, 26]

Nous pouvons voir qu’une liste de valeurs de points est produite pour chaque équipe unique dans le DataFrame.

Exemple 2 : regrouper les lignes dans une liste pour plusieurs colonnes

Nous pouvons utiliser la syntaxe suivante pour regrouper les lignes par colonne d’équipe et produire une liste de valeurs pour les colonnes de points et d’assistance :

#group points and assists values into lists by team
df.groupby('team').agg(list)

	points	         assists
team		
A	[10, 10, 12, 15] [6, 8, 9, 11]
B	[19, 23]	 [13, 8]
C	[20, 20, 26]	 [8, 15, 10]

Nous pouvons voir qu’une liste de valeurs de points et une liste de valeurs de passes décisives sont produites pour chaque équipe unique dans le DataFrame.

Remarque : Vous pouvez trouver la documentation complète de l’opération GroupBy dans pandas ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Pandas : comment calculer la somme cumulée par groupe
Pandas : comment compter les valeurs uniques par groupe
Pandas : comment calculer le mode par groupe
Pandas : comment calculer la corrélation par groupe

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *