Panda's: hoe je nan-waarden vult met waarden uit een andere kolom
U kunt de volgende syntaxis gebruiken om NaN-waarden in de ene kolom van een pandas DataFrame te vervangen door waarden in een andere kolom:
df[' col1 '] = df[' col1 ']. fillna (df[' col2 '])
Deze specifieke syntaxis vervangt alle NaN-waarden in col1 door de overeenkomstige waarden in col2 .
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Vervang ontbrekende waarden door een andere kolom
Laten we aannemen dat we de volgende panda’s DataFrame hebben met een paar ontbrekende waarden:
import numpy as np import pandas as pd #create DataFrame with some NaN values df = pd. DataFrame ({' team1 ': ['Mavs', np.nan, 'Nets', 'Hawks', np.nan, 'Jazz'], ' team2 ': ['Spurs', 'Lakers', 'Kings', 'Celtics', 'Heat', 'Magic']}) #view DataFrame df team1 team2 0 Mavs Spurs 1 NaN Lakers 2 Nets Kings 3 Hawks Celtics 4 NaN Heat 5 Jazz Magic
Merk op dat er twee NaN-waarden in de team1- kolom staan.
We kunnen de functie fillna() gebruiken om de NaN-waarden in de team1- kolom te vullen met de overeenkomstige waarde in de team2- kolom:
#fill NaNs in team1 column with corresponding values in team2 column df[' team1 '] = df[' team1 ']. fillna (df[' team2 ']) #view updated DataFrame df team1 team2 0 Mavs Spurs 1 Lakers Lakers 2 Nets Kings 3 Hawks Celtics 4 Heat Heat 5 Jazz Magic
Merk op dat de twee NaN-waarden in de team1- kolom zijn vervangen door de overeenkomstige waarden in de team2- kolom.
Opmerking : u kunt hier de volledige online documentatie voor de functie fillna() vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe ontbrekende waarden bij panda’s te tellen
Hoe rijen met NaN-waarden in Panda’s te verwijderen
Hoe rijen met een specifieke waarde in Pandas te verwijderen