Hoe na-waarden voor meerdere kolommen in panda's te vullen
De functie pandas fillna() is handig voor het vullen van ontbrekende waarden in de kolommen van een pandas DataFrame.
Deze tutorial biedt verschillende voorbeelden van het gebruik van deze functie om ontbrekende waarden in te vullen voor meerdere kolommen in de volgende panda’s DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({'team': ['A', np. nan , 'B', 'B', 'B', 'C', 'C', 'C'], 'points': [25, np. no , 15, np. no , 19, 23, 25, 29], 'assists': [5, 7, 7, 9, 12, 9, np. no , 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5.0 11 1 NaN NaN 7.0 8 2 B 15.0 7.0 10 3 B NaN 9.0 6 4 B 19.0 12.0 6 5 C 23.0 9.0 5 6 C 25.0 NaN 9 7 C 29.0 4.0 12
Voorbeeld 1: Vul de ontbrekende waarden van alle kolommen in
De volgende code laat zien hoe je ontbrekende waarden vult met een nul voor alle kolommen in het DataFrame:
#replace all missing values with zero df. fillna (value= 0 ,inplace= True ) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5.0 11 1 0 0.0 7.0 8 2 B 15.0 7.0 10 3 B 0.0 9.0 6 4 B 19.0 12.0 6 5 C 23.0 9.0 5 6 C 25.0 0.0 9 7 C 29.0 4.0 12
Voorbeeld 2: Vul ontbrekende waarden in voor meerdere kolommen
De volgende code laat zien hoe u ontbrekende waarden alleen met een nul kunt vullen voor de punt- en helperkolommen van het DataFrame:
#replace missing values in points and assists columns with zero df[['points', 'assists']] = df[['points', 'assists']]. fillna (value= 0 ) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5.0 11 1 NaN 0.0 7.0 8 2 B 15.0 7.0 10 3 B 0.0 9.0 6 4 B 19.0 12.0 6 5 C 23.0 9.0 5 6 C 25.0 0.0 9 7 C 29.0 4.0 12
Voorbeeld 3: Vul ontbrekende waarden uit meerdere kolommen met verschillende waarden in
De volgende code laat zien hoe je ontbrekende waarden in drie verschillende kolommen kunt invullen met drie verschillende waarden:
#replace missing values in three columns with three different values df. fillna ({'team': ' Unknown ', 'points': 0 , 'assists': ' zero '}, inplace= True ) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5 11 1 Unknown 0.0 7 8 2 B 15.0 7 10 3 B 0.0 9 6 4 B 19.0 12 6 5 C 23.0 9 5 6 C 25.0 zero 9 7 C 29.0 4 12
Merk op dat elk van de ontbrekende waarden in de drie kolommen is vervangen door een unieke waarde.