So füllen sie na-werte für mehrere spalten in pandas
Die Funktion pandas fillna() ist nützlich, um fehlende Werte in den Spalten eines pandas DataFrame zu füllen.
Dieses Tutorial bietet mehrere Beispiele für die Verwendung dieser Funktion zum Ausfüllen fehlender Werte für mehrere Spalten im folgenden Pandas-DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({'team': ['A', np. nan , 'B', 'B', 'B', 'C', 'C', 'C'], 'points': [25, np. no , 15, np. no , 19, 23, 25, 29], 'assists': [5, 7, 7, 9, 12, 9, np. no , 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5.0 11 1 NaN NaN 7.0 8 2 B 15.0 7.0 10 3 B NaN 9.0 6 4 B 19.0 12.0 6 5 C 23.0 9.0 5 6 C 25.0 NaN 9 7 C 29.0 4.0 12
Beispiel 1: Füllen Sie die fehlenden Werte aller Spalten aus
Der folgende Code zeigt, wie fehlende Werte für alle Spalten im DataFrame mit einer Null gefüllt werden:
#replace all missing values with zero df. fillna (value= 0 ,inplace= True ) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5.0 11 1 0 0.0 7.0 8 2 B 15.0 7.0 10 3 B 0.0 9.0 6 4 B 19.0 12.0 6 5 C 23.0 9.0 5 6 C 25.0 0.0 9 7 C 29.0 4.0 12
Beispiel 2: Fehlende Werte für mehrere Spalten ergänzen
Der folgende Code zeigt, wie fehlende Werte nur für die Punkt- und Hilfsspalten des DataFrame mit einer Null gefüllt werden:
#replace missing values in points and assists columns with zero df[['points', 'assists']] = df[['points', 'assists']]. fillna (value= 0 ) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5.0 11 1 NaN 0.0 7.0 8 2 B 15.0 7.0 10 3 B 0.0 9.0 6 4 B 19.0 12.0 6 5 C 23.0 9.0 5 6 C 25.0 0.0 9 7 C 29.0 4.0 12
Beispiel 3: Fehlende Werte aus mehreren Spalten mit unterschiedlichen Werten ergänzen
Der folgende Code zeigt, wie fehlende Werte in drei verschiedenen Spalten mit drei verschiedenen Werten gefüllt werden:
#replace missing values in three columns with three different values df. fillna ({'team': ' Unknown ', 'points': 0 , 'assists': ' zero '}, inplace= True ) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5 11 1 Unknown 0.0 7 8 2 B 15.0 7 10 3 B 0.0 9 6 4 B 19.0 12 6 5 C 23.0 9 5 6 C 25.0 zero 9 7 C 29.0 4 12
Beachten Sie, dass jeder der fehlenden Werte in den drei Spalten durch einen eindeutigen Wert ersetzt wurde.