Pandas : Comment créer un tableau croisé dynamique avec le nombre de valeurs
Vous pouvez utiliser l’une des méthodes suivantes pour créer un tableau croisé dynamique dans pandas qui affiche le nombre de valeurs dans certaines colonnes :
Méthode 1 : tableau croisé dynamique avec nombres
pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='count')
Méthode 2 : tableau croisé dynamique avec des nombres uniques
pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc=pd.Series.nunique)
Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], 'position': ['G', 'G', 'F', 'C', 'G', 'F', 'F', 'F'], 'points': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame df team position points 0 A G 4 1 A G 4 2 A F 6 3 A C 8 4 B G 9 5 B F 5 6 B F 5 7 B F 12
Méthode 1 : créer un tableau croisé dynamique Pandas avec des décomptes
Le code suivant montre comment créer un tableau croisé dynamique dans pandas qui affiche le nombre total de valeurs de « points » pour chaque « équipe » et « position » dans le DataFrame :
#create pivot table
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position',
aggfunc='count')
#view pivot table
df_pivot
position C F G
team
A 1.0 1.0 2.0
B NaN 3.0 1.0
À partir du résultat, nous pouvons voir :
- Il y a 1 valeur dans la colonne « points » pour l’équipe A à la position C.
- Il y a 1 valeur dans la colonne « points » pour l’équipe A à la position F.
- Il y a 2 valeurs dans la colonne « points » pour l’équipe A en position G.
Et ainsi de suite.
Méthode 2 : créer un tableau croisé dynamique Pandas avec des décomptes uniques
Le code suivant montre comment créer un tableau croisé dynamique dans pandas qui affiche le nombre total unique de valeurs « points » pour chaque « équipe » et « position » dans le DataFrame :
#create pivot table
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position',
aggfunc=pd.Series.nunique)
#view pivot table
df_pivot
position C F G
team
A 1.0 1.0 1.0
B NaN 2.0 1.0
À partir du résultat, nous pouvons voir :
- Il y a 1 valeur unique dans la colonne « points » pour l’équipe A à la position C.
- Il y a 1 valeur unique dans la colonne « points » pour l’équipe A en position F.
- Il y a 1 valeur unique dans la colonne « points » pour l’équipe A en position G.
Et ainsi de suite.
Remarque : Vous pouvez trouver la documentation complète de la fonction pandas pivot_table() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Pandas : Comment remodeler le DataFrame de long à large
Pandas : Comment remodeler le DataFrame de large à long
Pandas : comment regrouper et agréger sur plusieurs colonnes