Pandas : comment remplir des valeurs NaN à l’aide d’un dictionnaire



Vous pouvez utiliser la fonction fillna() avec un dictionnaire pour remplacer les valeurs NaN dans une colonne d’un DataFrame pandas en fonction des valeurs d’une autre colonne.

Pour ce faire, vous pouvez utiliser la syntaxe de base suivante :

#define dictionary
dict = {'A':5, 'B':10, 'C':15, 'D':20}

#replace values in col2 based on dictionary values in col1
df['col2'] = df['col2'].fillna(df['col1'].map(dict))

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : Remplissez les valeurs NaN dans Pandas à l’aide d’un dictionnaire

Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur les ventes réalisées dans divers magasins de détail :

import pandas as pd
import numpy as np

#create DataFrame
df = pd.DataFrame({'store': ['A', 'A', 'B', 'C', 'D', 'C', 'B', 'D'],
                   'sales': [12, np.nan, 30, np.nan, 24, np.nan, np.nan, 13]})

#view DataFrame
print(df)

  store  sales
0     A   12.0
1     A    NaN
2     B   30.0
3     C    NaN
4     D   24.0
5     C    NaN
6     B    NaN
7     D   13.0

Notez qu’il existe plusieurs valeurs NaN dans la colonne des ventes .

Supposons que nous souhaitions remplir ces NaN dans la colonne des ventes en utilisant des valeurs qui correspondent à des valeurs spécifiques dans la colonne du magasin .

Nous pouvons utiliser la syntaxe suivante pour ce faire :

#define dictionary
dict = {'A':5, 'B':10, 'C':15, 'D':20}

#replace values in sales column based on dictionary values in store column
df['sales'] = df['sales'].fillna(df['store'].map(dict))

#view updated DataFrame
print(df)

  store  sales
0     A   12.0
1     A    5.0
2     B   30.0
3     C   15.0
4     D   24.0
5     C   15.0
6     B   10.0
7     D   13.0

Nous avons utilisé un dictionnaire pour effectuer les remplacements suivants dans la colonne ventes :

  • Si le magasin est A , remplacez NaN dans ventes par la valeur 5 .
  • Si le magasin est B , remplacez NaN dans sales par la valeur 10 .
  • Si store est C , remplacez NaN dans sales par la valeur 15 .
  • Si le magasin est D , remplacez NaN dans sales par la valeur 20 .

Vous pouvez trouver la documentation complète en ligne de la fonction fillna() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment compter les valeurs manquantes chez les pandas
Comment supprimer des lignes avec des valeurs NaN dans Pandas
Comment supprimer des lignes contenant une valeur spécifique dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *