So unterstellen sie fehlende werte in pandas (einschließlich beispiel)
Sie können die folgende grundlegende Syntax verwenden, um fehlende Werte in einem Pandas-DataFrame zu imputieren:
df[' column_name '] = df[' column_name ']. interpolate ()
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Fehlende Werte in Pandas interpolieren
Nehmen wir an, wir haben den folgenden Pandas-DataFrame, der die Gesamtverkäufe eines Geschäfts an 15 aufeinanderfolgenden Tagen anzeigt:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15], ' sales ': [3, 6, 8, 10, 14, 17, 20, np.nan, np.nan, np.nan, np.nan, 35, 39, 44, 49]}) #view DataFrame print (df) day sales 0 1 3.0 1 2 6.0 2 3 8.0 3 4 10.0 4 5 14.0 5 6 17.0 6 7 20.0 7 8 NaN 8 9 NaN 9 10 NaN 10 11 NaN 11 12 35.0 12 13 39.0 13 14 44.0 14 15 49.0
Beachten Sie, dass uns im Datenrahmen Verkaufszahlen für vier Tage fehlen.
Wenn wir ein einfaches Liniendiagramm erstellen würden, um Verkäufe im Zeitverlauf zu visualisieren, würde es so aussehen:
#create line chart to visualize sales df[' sales ']. plot ()
Um die fehlenden Werte zu ergänzen, können wir die Funktion interpolate() wie folgt verwenden:
#interpolate missing values in 'sales' column df[' sales '] = df[' sales ']. interpolate () #view DataFrame print (df) day sales 0 1 3.0 1 2 6.0 2 3 8.0 3 4 10.0 4 5 14.0 5 6 17.0 6 7 20.0 7 8 23.0 8 9 26.0 9 10 29.0 10 11 32.0 11 12 35.0 12 13 39.0 13 14 44.0 14 15 49.0
Beachten Sie, dass jeder der fehlenden Werte ersetzt wurde.
Wenn wir ein weiteres Liniendiagramm erstellen, um den aktualisierten Datenrahmen zu visualisieren, würde es so aussehen:
#create line chart to visualize sales df[' sales ']. plot ()
Beachten Sie, dass die von der Funktion interpolate() ausgewählten Werte offenbar recht gut mit dem Trend der Daten übereinstimmen.
Hinweis : Die vollständige Dokumentation zur Funktion interpolate() finden Sie hier .
Zusätzliche Ressourcen
Die folgenden Tutorials bieten zusätzliche Informationen zum Umgang mit fehlenden Werten in Pandas:
So zählen Sie fehlende Werte in Pandas
So ersetzen Sie NaN-Werte in Pandas durch eine Zeichenfolge
So ersetzen Sie NaN-Werte in Pandas durch Null