So unterstellen sie fehlende werte in pandas (einschließlich beispiel)


Sie können die folgende grundlegende Syntax verwenden, um fehlende Werte in einem Pandas-DataFrame zu imputieren:

 df[' column_name '] = df[' column_name ']. interpolate ()

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Fehlende Werte in Pandas interpolieren

Nehmen wir an, wir haben den folgenden Pandas-DataFrame, der die Gesamtverkäufe eines Geschäfts an 15 aufeinanderfolgenden Tagen anzeigt:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15],
                   ' sales ': [3, 6, 8, 10, 14, 17, 20, np.nan, np.nan, np.nan,
                             np.nan, 35, 39, 44, 49]})

#view DataFrame
print (df)

    day sales
0 1 3.0
1 2 6.0
2 3 8.0
3 4 10.0
4 5 14.0
5 6 17.0
6 7 20.0
7 8 NaN
8 9 NaN
9 10 NaN
10 11 NaN
11 12 35.0
12 13 39.0
13 14 44.0
14 15 49.0

Beachten Sie, dass uns im Datenrahmen Verkaufszahlen für vier Tage fehlen.

Wenn wir ein einfaches Liniendiagramm erstellen würden, um Verkäufe im Zeitverlauf zu visualisieren, würde es so aussehen:

 #create line chart to visualize sales
df[' sales ']. plot ()

fehlende Werte in Pandas unterstellen

Um die fehlenden Werte zu ergänzen, können wir die Funktion interpolate() wie folgt verwenden:

 #interpolate missing values in 'sales' column
df[' sales '] = df[' sales ']. interpolate ()

#view DataFrame
print (df)

    day sales
0 1 3.0
1 2 6.0
2 3 8.0
3 4 10.0
4 5 14.0
5 6 17.0
6 7 20.0
7 8 23.0
8 9 26.0
9 10 29.0
10 11 32.0
11 12 35.0
12 13 39.0
13 14 44.0
14 15 49.0

Beachten Sie, dass jeder der fehlenden Werte ersetzt wurde.

Wenn wir ein weiteres Liniendiagramm erstellen, um den aktualisierten Datenrahmen zu visualisieren, würde es so aussehen:

 #create line chart to visualize sales
df[' sales ']. plot ()

Beachten Sie, dass die von der Funktion interpolate() ausgewählten Werte offenbar recht gut mit dem Trend der Daten übereinstimmen.

Hinweis : Die vollständige Dokumentation zur Funktion interpolate() finden Sie hier .

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zum Umgang mit fehlenden Werten in Pandas:

So zählen Sie fehlende Werte in Pandas
So ersetzen Sie NaN-Werte in Pandas durch eine Zeichenfolge
So ersetzen Sie NaN-Werte in Pandas durch Null

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert