Hoe na-waarden voor meerdere kolommen in panda's te vullen


De functie pandas fillna() is handig voor het vullen van ontbrekende waarden in de kolommen van een pandas DataFrame.

Deze tutorial biedt verschillende voorbeelden van het gebruik van deze functie om ontbrekende waarden in te vullen voor meerdere kolommen in de volgende panda’s DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({'team': ['A', np. nan , 'B', 'B', 'B', 'C', 'C', 'C'],
                   'points': [25, np. no , 15, np. no , 19, 23, 25, 29],
                   'assists': [5, 7, 7, 9, 12, 9, np. no , 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 25.0 5.0 11
1 NaN NaN 7.0 8
2 B 15.0 7.0 10
3 B NaN 9.0 6
4 B 19.0 12.0 6
5 C 23.0 9.0 5
6 C 25.0 NaN 9
7 C 29.0 4.0 12

Voorbeeld 1: Vul de ontbrekende waarden van alle kolommen in

De volgende code laat zien hoe je ontbrekende waarden vult met een nul voor alle kolommen in het DataFrame:

 #replace all missing values with zero
df. fillna (value= 0 ,inplace= True )

#view DataFrame
print (df) 

  team points assists rebounds
0 A 25.0 5.0 11
1 0 0.0 7.0 8
2 B 15.0 7.0 10
3 B 0.0 9.0 6
4 B 19.0 12.0 6
5 C 23.0 9.0 5
6 C 25.0 0.0 9
7 C 29.0 4.0 12

Voorbeeld 2: Vul ontbrekende waarden in voor meerdere kolommen

De volgende code laat zien hoe u ontbrekende waarden alleen met een nul kunt vullen voor de punt- en helperkolommen van het DataFrame:

 #replace missing values in points and assists columns with zero
df[['points', 'assists']] = df[['points', 'assists']]. fillna (value= 0 )

#view DataFrame
print (df) 

  team points assists rebounds
0 A 25.0 5.0 11
1 NaN 0.0 7.0 8
2 B 15.0 7.0 10
3 B 0.0 9.0 6
4 B 19.0 12.0 6
5 C 23.0 9.0 5
6 C 25.0 0.0 9
7 C 29.0 4.0 12

Voorbeeld 3: Vul ontbrekende waarden uit meerdere kolommen met verschillende waarden in

De volgende code laat zien hoe je ontbrekende waarden in drie verschillende kolommen kunt invullen met drie verschillende waarden:

 #replace missing values in three columns with three different values
df. fillna ({'team': ' Unknown ', 'points': 0 , 'assists': ' zero '}, inplace= True )

#view DataFrame
print (df)

      team points assists rebounds
0 A 25.0 5 11
1 Unknown 0.0 7 8
2 B 15.0 7 10
3 B 0.0 9 6
4 B 19.0 12 6
5 C 23.0 9 5
6 C 25.0 zero 9
7 C 29.0 4 12

Merk op dat elk van de ontbrekende waarden in de drie kolommen is vervangen door een unieke waarde.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert