Pandas : Comment créer un tableau croisé dynamique avec une somme de valeurs



Vous pouvez utiliser la syntaxe de base suivante pour créer un tableau croisé dynamique dans pandas qui affiche la somme des valeurs dans certaines colonnes :

pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : créer un tableau croisé dynamique Pandas avec une somme de valeurs

Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur divers joueurs de basket-ball :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'position': ['G', 'G', 'F', 'F', 'G', 'F', 'F', 'F'],
                   'points': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print(df)


  team position  points
0    A        G       4
1    A        G       4
2    A        F       6
3    A        F       8
4    B        G       9
5    B        F       5
6    B        F       5
7    B        F      12

Le code suivant montre comment créer un tableau croisé dynamique dans pandas qui affiche la somme des valeurs de « points » pour chaque « équipe » et « position » dans le DataFrame :

#create pivot table
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position',
                          aggfunc='sum')

#view pivot table
print(df_pivot)

position   F  G
team           
A         14  8
B         22  9

À partir du résultat, nous pouvons voir :

  • Les joueurs de l’équipe A en position F ont marqué un total de 14 points.
  • Les joueurs de l’équipe A en position G ont marqué un total de 8 points.
  • Les joueurs de l’équipe B en position F ont marqué un total de 22 points.
  • Les joueurs de l’équipe B en position G ont marqué un total de 9 points.

Notez que nous pouvons également utiliser l’argument margins pour afficher les sommes de marges dans le tableau croisé dynamique :

#create pivot table with margins
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position',
                          aggfunc='sum', margins=True, margins_name='Sum')

#view pivot table
print(df_pivot)

position   F   G  Sum
team                 
A         14   8   22
B         22   9   31
Sum       36  17   53

Le tableau croisé dynamique affiche désormais les sommes des lignes et des colonnes.

Remarque : Vous pouvez trouver la documentation complète de la fonction pandas pivot_table() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Pandas : Comment remodeler le DataFrame de long à large
Pandas : Comment remodeler le DataFrame de large à long
Pandas : comment regrouper et agréger sur plusieurs colonnes

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *