Pandas : Comment créer un tableau croisé dynamique avec le nombre de valeurs



Vous pouvez utiliser l’une des méthodes suivantes pour créer un tableau croisé dynamique dans pandas qui affiche le nombre de valeurs dans certaines colonnes :

Méthode 1 : tableau croisé dynamique avec nombres

pd.pivot_table(df, values='col1', index='col2', columns='col3',
               aggfunc='count')

Méthode 2 : tableau croisé dynamique avec des nombres uniques

pd.pivot_table(df, values='col1', index='col2', columns='col3',
               aggfunc=pd.Series.nunique)

Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'position': ['G', 'G', 'F', 'C', 'G', 'F', 'F', 'F'],
                   'points': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
df

	team	position points
0	A	G	 4
1	A	G	 4
2	A	F	 6
3	A	C	 8
4	B	G	 9
5	B	F	 5
6	B	F	 5
7	B	F	 12

Méthode 1 : créer un tableau croisé dynamique Pandas avec des décomptes

Le code suivant montre comment créer un tableau croisé dynamique dans pandas qui affiche le nombre total de valeurs de « points » pour chaque « équipe » et « position » dans le DataFrame :

#create pivot table
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position',
                          aggfunc='count')

#view pivot table
df_pivot

position	C	  F	  G
team			
   A	      1.0	1.0	2.0
   B	      NaN	3.0	1.0

À partir du résultat, nous pouvons voir :

  • Il y a 1 valeur dans la colonne « points » pour l’équipe A à la position C.
  • Il y a 1 valeur dans la colonne « points » pour l’équipe A à la position F.
  • Il y a 2 valeurs dans la colonne « points » pour l’équipe A en position G.

Et ainsi de suite.

Méthode 2 : créer un tableau croisé dynamique Pandas avec des décomptes uniques

Le code suivant montre comment créer un tableau croisé dynamique dans pandas qui affiche le nombre total unique de valeurs « points » pour chaque « équipe » et « position » dans le DataFrame :

#create pivot table
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position',
                          aggfunc=pd.Series.nunique)

#view pivot table
df_pivot

position	C	  F	  G
team			
   A	      1.0	1.0	1.0
   B	      NaN	2.0	1.0

À partir du résultat, nous pouvons voir :

  • Il y a 1 valeur unique dans la colonne « points » pour l’équipe A à la position C.
  • Il y a 1 valeur unique dans la colonne « points » pour l’équipe A en position F.
  • Il y a 1 valeur unique dans la colonne « points » pour l’équipe A en position G.

Et ainsi de suite.

Remarque : Vous pouvez trouver la documentation complète de la fonction pandas pivot_table() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Pandas : Comment remodeler le DataFrame de long à large
Pandas : Comment remodeler le DataFrame de large à long
Pandas : comment regrouper et agréger sur plusieurs colonnes

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *