Pandas : Comment utiliser as_index dans groupby
Vous pouvez utiliser l’argument as_index dans une opération pandas groupby() pour spécifier si vous souhaitez ou non que la colonne par laquelle vous avez regroupé soit utilisée comme index de la sortie.
L’argument as_index peut prendre la valeur True ou False .
La valeur par défaut est True .
L’exemple suivant montre comment utiliser l’argument as_index dans la pratique.
Exemple : Comment utiliser as_index dans pandas groupby
Supposons que nous ayons le DataFrame pandas suivant qui montre le nombre de points marqués par les basketteurs de différentes équipes :
import pandas as pd
#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
'points': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28]})
#view DataFrame
print(df)
team points
0 A 12
1 A 15
2 A 17
3 A 17
4 A 19
5 B 14
6 B 15
7 C 20
8 C 24
9 C 28
Nous pouvons utiliser la syntaxe suivante pour regrouper les lignes par colonne d’équipe et calculer la somme de la colonne de points , tout en spécifiant as_index=True pour utiliser team comme index de sortie :
#group rows by team and calculate sum of points
print(df.groupby('team', as_index=True).sum())
points
team
A 80
B 29
C 72
La sortie affiche la somme des valeurs dans la colonne des points , regroupées par les valeurs de la colonne de l’ équipe .
Notez que la colonne team est utilisée comme index de la sortie.
Si nous spécifions plutôt as_index=False alors la colonne team ne sera pas utilisée comme index de la sortie :
#group rows by team and calculate sum of points
print(df.groupby('team', as_index=False).sum())
team points
0 A 80
1 B 29
2 C 72
Notez que l’équipe est désormais utilisée comme colonne dans la sortie et que la colonne d’index est simplement numérotée de 0 à 2.
Remarque : Vous pouvez trouver la documentation complète de l’opération pandas groupby() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment obtenir un groupe après avoir utilisé Pandas Groupby
Comment convertir la sortie Pandas GroupBy en DataFrame
Comment appliquer une fonction à Pandas Groupby