Pandas : comment remplir des valeurs NaN à l’aide d’un dictionnaire
Vous pouvez utiliser la fonction fillna() avec un dictionnaire pour remplacer les valeurs NaN dans une colonne d’un DataFrame pandas en fonction des valeurs d’une autre colonne.
Pour ce faire, vous pouvez utiliser la syntaxe de base suivante :
#define dictionary dict = {'A':5, 'B':10, 'C':15, 'D':20} #replace values in col2 based on dictionary values in col1 df['col2'] = df['col2'].fillna(df['col1'].map(dict))
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : Remplissez les valeurs NaN dans Pandas à l’aide d’un dictionnaire
Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur les ventes réalisées dans divers magasins de détail :
import pandas as pd import numpy as np #create DataFrame df = pd.DataFrame({'store': ['A', 'A', 'B', 'C', 'D', 'C', 'B', 'D'], 'sales': [12, np.nan, 30, np.nan, 24, np.nan, np.nan, 13]}) #view DataFrame print(df) store sales 0 A 12.0 1 A NaN 2 B 30.0 3 C NaN 4 D 24.0 5 C NaN 6 B NaN 7 D 13.0
Notez qu’il existe plusieurs valeurs NaN dans la colonne des ventes .
Supposons que nous souhaitions remplir ces NaN dans la colonne des ventes en utilisant des valeurs qui correspondent à des valeurs spécifiques dans la colonne du magasin .
Nous pouvons utiliser la syntaxe suivante pour ce faire :
#define dictionary dict = {'A':5, 'B':10, 'C':15, 'D':20} #replace values in sales column based on dictionary values in store column df['sales'] = df['sales'].fillna(df['store'].map(dict)) #view updated DataFrame print(df) store sales 0 A 12.0 1 A 5.0 2 B 30.0 3 C 15.0 4 D 24.0 5 C 15.0 6 B 10.0 7 D 13.0
Nous avons utilisé un dictionnaire pour effectuer les remplacements suivants dans la colonne ventes :
- Si le magasin est A , remplacez NaN dans ventes par la valeur 5 .
- Si le magasin est B , remplacez NaN dans sales par la valeur 10 .
- Si store est C , remplacez NaN dans sales par la valeur 15 .
- Si le magasin est D , remplacez NaN dans sales par la valeur 20 .
Vous pouvez trouver la documentation complète en ligne de la fonction fillna() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment compter les valeurs manquantes chez les pandas
Comment supprimer des lignes avec des valeurs NaN dans Pandas
Comment supprimer des lignes contenant une valeur spécifique dans Pandas