Pandas : Comment utiliser as_index dans groupby



Vous pouvez utiliser l’argument as_index dans une opération pandas groupby() pour spécifier si vous souhaitez ou non que la colonne par laquelle vous avez regroupé soit utilisée comme index de la sortie.

L’argument as_index peut prendre la valeur True ou False .

La valeur par défaut est True .

L’exemple suivant montre comment utiliser l’argument as_index dans la pratique.

Exemple : Comment utiliser as_index dans pandas groupby

Supposons que nous ayons le DataFrame pandas suivant qui montre le nombre de points marqués par les basketteurs de différentes équipes :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
                   'points': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28]})
                            
#view DataFrame
print(df)

  team  points
0    A      12
1    A      15
2    A      17
3    A      17
4    A      19
5    B      14
6    B      15
7    C      20
8    C      24
9    C      28

Nous pouvons utiliser la syntaxe suivante pour regrouper les lignes par colonne d’équipe et calculer la somme de la colonne de points , tout en spécifiant as_index=True pour utiliser team comme index de sortie :

#group rows by team and calculate sum of points
print(df.groupby('team', as_index=True).sum())

      points
team        
A         80
B         29
C         72

La sortie affiche la somme des valeurs dans la colonne des points , regroupées par les valeurs de la colonne de l’ équipe .

Notez que la colonne team est utilisée comme index de la sortie.

Si nous spécifions plutôt as_index=False alors la colonne team ne sera pas utilisée comme index de la sortie :

#group rows by team and calculate sum of points
print(df.groupby('team', as_index=False).sum())

  team  points
0    A      80
1    B      29
2    C      72

Notez que l’équipe est désormais utilisée comme colonne dans la sortie et que la colonne d’index est simplement numérotée de 0 à 2.

Remarque : Vous pouvez trouver la documentation complète de l’opération pandas groupby() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment obtenir un groupe après avoir utilisé Pandas Groupby
Comment convertir la sortie Pandas GroupBy en DataFrame
Comment appliquer une fonction à Pandas Groupby

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *