Pandas : Comment ajouter un filtre au tableau croisé dynamique



Vous pouvez utiliser la syntaxe de base suivante pour ajouter une condition de filtrage à un tableau croisé dynamique pandas :

df[df.col1 == 'A'].pivot_table(index='col1', values=['col2', 'col3'], aggfunc='sum')

Cet exemple particulier crée un tableau croisé dynamique qui affiche la somme des valeurs de col2 et col3 , regroupées par col1 .

Le filtre avant la fonction pivot_table() spécifie que nous souhaitons inclure uniquement les lignes où la valeur dans col1 du DataFrame d’origine a la valeur « A ».

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : Comment ajouter un filtre au tableau croisé dynamique Pandas

Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur divers joueurs de basket-ball :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   'points': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   'assists': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print(df)

   team  points  assists
0     A       4        2
1     A       4        2
2     A       2        5
3     A       8        5
4     B       9        4
5     B       5        7
6     B       5        5
7     B       7        3
8     C       8        9
9     C       8        8
10    C       4        4
11    C       3        4

Nous pouvons utiliser le code suivant pour créer un tableau croisé dynamique dans pandas qui affiche la somme des valeurs dans les colonnes de points et d’assistance regroupées par équipe uniquement pour les lignes où le DataFrame d’origine a une valeur dans la colonne d’équipe égale à « A » :

#create pivot table for rows where team is equal to 'A'
df[df.team == 'A'].pivot_table(index='team', values=['points', 'assists'],
                                 aggfunc='sum')

        assists	points
team		
A	14	18

Notez que le tableau croisé dynamique résume uniquement les valeurs des colonnes de points et d’assistance pour les lignes où l’ équipe est égale à « A ».

Vous pouvez également utiliser les opérateurs & et | pour appliquer un filtre qui utilise la logique « ET » ou « OU ».

Par exemple, nous pouvons utiliser la syntaxe suivante pour créer un tableau croisé dynamique qui filtre les lignes où la valeur dans la colonne d’équipe du DataFrame d’origine est égale à « A » ou « B » :

#create pivot table for rows where team is equal to 'A' or 'B'
df[(df.team == 'A') | (df.team == 'B')].pivot_table(index='team',
                                                    values=['points', 'assists'],
                                                    aggfunc='sum')

	assists	points
team		
A	14	18
B	19	26

Notez que le tableau croisé dynamique résume uniquement les valeurs dans les colonnes de points et d’assistance pour les lignes où l’ équipe est égale à « A » ou « B ».

Remarque : Vous pouvez trouver la documentation complète de la fonction pandas pivot_table() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :

Pandas : Comment trier le tableau croisé dynamique par valeurs dans la colonne
Pandas : Comment créer un tableau croisé dynamique avec une somme de valeurs
Pandas : Comment ajouter des sous-totaux au tableau croisé dynamique
Pandas : Comment modifier les noms de colonnes dans un tableau croisé dynamique

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *