Pandas : Comment trier le tableau croisé dynamique par valeurs dans la colonne



Vous pouvez utiliser la syntaxe de base suivante pour trier un tableau croisé dynamique pandas en fonction des valeurs d’une colonne :

my_pivot_table.sort_values(by=['some_column'], ascending=False)

Cet exemple particulier trie les valeurs d’un tableau croisé dynamique appelé my_pivot_table en fonction des valeurs de some_column par ordre décroissant.

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : Trier le tableau croisé dynamique Pandas par valeurs dans la colonne

Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur divers joueurs de basket-ball :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   'points': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   'assists': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print(df)

   team  points  assists
0     A       4        2
1     A       4        2
2     A       2        5
3     A       8        5
4     B       9        4
5     B       5        7
6     B       5        5
7     B       7        3
8     C       8        9
9     C       8        8
10    C       4        4
11    C       3        4

Nous pouvons utiliser le code suivant pour créer un tableau croisé dynamique dans pandas qui affiche la somme des valeurs dans les colonnes de points et d’assistance pour chaque équipe :

#create pivot table
df_pivot = df.pivot_table(index=['team'], values=['points', 'assists'], aggfunc='sum')

#view pivot table
print(df_pivot)

      assists  points
team                 
A          14      18
B          19      26
C          25      23

Par défaut, pandas trie les lignes du tableau croisé dynamique par ordre alphabétique en fonction de la valeur de la colonne d’index, qui se trouve être la colonne d’équipe .

Cependant, nous pouvons utiliser la fonction sort_values() pour trier les lignes du tableau croisé dynamique en fonction des valeurs de la colonne de points :

#sort pivot table by value in 'points' column in descending order
sorted_df_pivot = df_pivot.sort_values(by=['points'], ascending=False)

#view sorted pivot table
print(sorted_df_pivot)

      assists  points
team                 
B          19      26
C          25      23
A          14      18

Notez que les lignes du tableau croisé dynamique sont désormais triées en fonction des valeurs de la colonne des points .

Notez que si vous omettez l’argument ascending=False , les lignes seront triées selon les valeurs de la colonne de points dans l’ordre croissant :

#sort pivot table by value in 'points' column in ascending order
sorted_df_pivot = df_pivot.sort_values(by=['points'])

#view sorted pivot table
print(sorted_df_pivot)

      assists  points
team                 
A          14      18
C          25      23
B          19      26

Notez que les lignes du tableau croisé dynamique sont désormais triées selon les valeurs de la colonne de points par ordre croissant (du plus petit au plus grand).

Remarque n°1 : Vous pouvez également trier sur plusieurs colonnes dans le tableau croisé dynamique en transmettant plusieurs valeurs à l’argument by dans la fonction sort_values() .

Note n°2 : Vous pouvez trouver la documentation complète de la fonction pandas pivot_table() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Pandas : Comment remodeler le DataFrame de long à large
Pandas : Comment remodeler le DataFrame de large à long
Pandas : comment regrouper et agréger sur plusieurs colonnes

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *