Panda's: hoe nan-waarden in te vullen met behulp van een woordenboek
Je kunt de functie fillna() gebruiken met een woordenboek om NaN-waarden in de ene kolom van een pandas DataFrame te vervangen op basis van waarden in een andere kolom.
Om dit te doen, kunt u de volgende basissyntaxis gebruiken:
#define dictionary dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 } #replace values in col2 based on dictionary values in col1 df[' col2 '] = df[' col2 ']. fillna (df[' col1 ']. map (dict))
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Vul NaN-waarden in Panda’s in met behulp van een woordenboek
Laten we zeggen dat we het volgende panda’s DataFrame hebben dat informatie bevat over verkopen in verschillende winkels:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' store ': ['A', 'A', 'B', 'C', 'D', 'C', 'B', 'D'], ' sales ': [12, np.nan, 30, np.nan, 24, np.nan, np.nan, 13]}) #view DataFrame print (df) blind sales 0 to 12.0 1 A NaN 2 B 30.0 3 C NaN 4 D 24.0 5CNaN 6BNaN 7 D 13.0
Houd er rekening mee dat er meerdere NaN-waarden in de kolom Verkoop staan.
Stel dat we deze NaN’s in de verkoopkolom willen invullen met waarden die overeenkomen met specifieke waarden in de winkelkolom .
We kunnen hiervoor de volgende syntaxis gebruiken:
#define dictionary dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 } #replace values in sales column based on dictionary values in store column df[' sales '] = df[' sales ']. fillna (df[' store ']. map (dict)) #view updated DataFrame print (df) blind sales 0 to 12.0 1 A 5.0 2 B 30.0 3C 15.0 4 D 24.0 5C 15.0 6 B 10.0 7 D 13.0
We hebben een woordenboek gebruikt om de volgende vervangingen in de verkoopkolom aan te brengen:
- Als de winkel A is, vervangt u NaN in Sales door de waarde 5 .
- Als de winkel B is, vervangt u NaN in verkopen door de waarde 10 .
- Als winkel C is, vervang dan NaN in verkoop door de waarde 15 .
- Als de winkel D is, vervangt u NaN in verkopen door de waarde 20 .
U kunt hier de volledige online documentatie voor de functie fillna() vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe ontbrekende waarden bij panda’s te tellen
Hoe rijen met NaN-waarden in Panda’s te verwijderen
Hoe rijen met een specifieke waarde in Pandas te verwijderen