So füllen sie na-werte für mehrere spalten in pandas


Die Funktion pandas fillna() ist nützlich, um fehlende Werte in den Spalten eines pandas DataFrame zu füllen.

Dieses Tutorial bietet mehrere Beispiele für die Verwendung dieser Funktion zum Ausfüllen fehlender Werte für mehrere Spalten im folgenden Pandas-DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({'team': ['A', np. nan , 'B', 'B', 'B', 'C', 'C', 'C'],
                   'points': [25, np. no , 15, np. no , 19, 23, 25, 29],
                   'assists': [5, 7, 7, 9, 12, 9, np. no , 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 25.0 5.0 11
1 NaN NaN 7.0 8
2 B 15.0 7.0 10
3 B NaN 9.0 6
4 B 19.0 12.0 6
5 C 23.0 9.0 5
6 C 25.0 NaN 9
7 C 29.0 4.0 12

Beispiel 1: Füllen Sie die fehlenden Werte aller Spalten aus

Der folgende Code zeigt, wie fehlende Werte für alle Spalten im DataFrame mit einer Null gefüllt werden:

 #replace all missing values with zero
df. fillna (value= 0 ,inplace= True )

#view DataFrame
print (df) 

  team points assists rebounds
0 A 25.0 5.0 11
1 0 0.0 7.0 8
2 B 15.0 7.0 10
3 B 0.0 9.0 6
4 B 19.0 12.0 6
5 C 23.0 9.0 5
6 C 25.0 0.0 9
7 C 29.0 4.0 12

Beispiel 2: Fehlende Werte für mehrere Spalten ergänzen

Der folgende Code zeigt, wie fehlende Werte nur für die Punkt- und Hilfsspalten des DataFrame mit einer Null gefüllt werden:

 #replace missing values in points and assists columns with zero
df[['points', 'assists']] = df[['points', 'assists']]. fillna (value= 0 )

#view DataFrame
print (df) 

  team points assists rebounds
0 A 25.0 5.0 11
1 NaN 0.0 7.0 8
2 B 15.0 7.0 10
3 B 0.0 9.0 6
4 B 19.0 12.0 6
5 C 23.0 9.0 5
6 C 25.0 0.0 9
7 C 29.0 4.0 12

Beispiel 3: Fehlende Werte aus mehreren Spalten mit unterschiedlichen Werten ergänzen

Der folgende Code zeigt, wie fehlende Werte in drei verschiedenen Spalten mit drei verschiedenen Werten gefüllt werden:

 #replace missing values in three columns with three different values
df. fillna ({'team': ' Unknown ', 'points': 0 , 'assists': ' zero '}, inplace= True )

#view DataFrame
print (df)

      team points assists rebounds
0 A 25.0 5 11
1 Unknown 0.0 7 8
2 B 15.0 7 10
3 B 0.0 9 6
4 B 19.0 12 6
5 C 23.0 9 5
6 C 25.0 zero 9
7 C 29.0 4 12

Beachten Sie, dass jeder der fehlenden Werte in den drei Spalten durch einen eindeutigen Wert ersetzt wurde.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert