Pandas : comment remplacer les valeurs NaN dans le tableau croisé dynamique par des zéros



Vous pouvez utiliser l’argument fill_value dans pandas pour remplacer les valeurs NaN dans un tableau croisé dynamique par des zéros.

Pour ce faire, vous pouvez utiliser la syntaxe de base suivante :

pd.pivot_table(df, values='col1', index='col2', columns='col3', fill_value=0)

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : Remplacer les valeurs NaN dans le tableau croisé dynamique par des zéros

Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur divers joueurs de basket-ball :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'position': ['G', 'G', 'F', 'C', 'F', 'F', 'F', 'F'],
                   'points': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
print(df)

	team	position points
0	A	G	 4
1	A	G	 4
2	A	F	 6
3	A	C	 8
4	B	F	 9
5	B	F	 5
6	B	F	 5
7	B	F	 12

Nous pouvons utiliser le code suivant pour créer un tableau croisé dynamique dans pandas qui montre la valeur moyenne des points pour chaque équipe et position dans le DataFrame :

#create pivot table
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position')

#view pivot table
print(df_pivot)

position    C     F    G
team                    
A         8.0  6.00  4.0
B         NaN  7.75  NaN

Notez qu’il y a deux valeurs NaN dans le tableau croisé dynamique car aucun joueur n’a une position C ou G dans l’équipe B dans le DataFrame d’origine, donc ces deux positions ont des valeurs NaN dans le tableau croisé dynamique.

Pour remplir ces valeurs NaN avec des zéros dans le tableau croisé dynamique, nous pouvons utiliser l’argument fill_value :

#create pivot table with zeros instead of NaN values
df_pivot = pd.pivot_table(df, values='points', index='team', columns='position',
                          fill_value=0)

#view pivot table
print(df_pivot)

position  C     F  G
team                
A         8  6.00  4
B         0  7.75  0

Notez que chacune des valeurs NaN du tableau croisé dynamique précédent a été remplie de zéros.

Remarque : Vous pouvez trouver la documentation complète de la fonction pandas pivot_table() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Pandas : Comment remodeler le DataFrame de long à large
Pandas : Comment remodeler le DataFrame de large à long
Pandas : comment regrouper et agréger sur plusieurs colonnes

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *