So interpolieren sie fehlende werte in r (einschließlich eines beispiels)
Sie können die folgende grundlegende Syntax verwenden, um fehlende Werte in einer Datenrahmenspalte in R zu interpolieren:
library (dplyr) library (zoo) df <- df %>% mutate(column_name = na. approx (column_name))
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Fehlende Werte in R interpolieren
Angenommen, wir haben den folgenden Datenrahmen in R, der die Gesamtverkäufe eines Geschäfts an 15 aufeinanderfolgenden Tagen zeigt:
#create data frame df <- data. frame (day=1:15, sales=c(3, 6, 8, 10, 14, 17, 20, NA, NA, NA, NA, 35, 39, 44, 49)) #view data frame df day sales 1 1 3 2 2 6 3 3 8 4 4 10 5 5 14 6 6 17 7 7 20 8 8 NA 9 9 NA 10 10 NA 11 11 NA 12 12 35 13 13 39 14 14 44 15 15 49
Beachten Sie, dass uns im Datenrahmen Verkaufszahlen für vier Tage fehlen.
Wenn wir ein einfaches Liniendiagramm erstellen würden, um Verkäufe im Zeitverlauf zu visualisieren, würde es so aussehen:
#create line chart to visualize sales plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ')
Um die fehlenden Werte zu ergänzen, können wir die Funktion na. approx() aus dem Paket zoo sowie die Funktion mutate() aus dem Paket dplyr verwenden:
library (dplyr) library (zoo) #interpolate missing values in 'sales' column df <- df %>% mutate(sales = na. approx (sales)) #view updated data frame df day sales 1 1 3 2 2 6 3 3 8 4 4 10 5 5 14 6 6 17 7 7 20 8 8 23 9 9 26 10 10 29 11 11 32 12 12 35 13 13 39 14 14 44 15 15 49
Beachten Sie, dass jeder der fehlenden Werte ersetzt wurde.
Wenn wir ein weiteres Liniendiagramm erstellen, um den aktualisierten Datenrahmen zu visualisieren, würde es so aussehen:
#create line chart to visualize sales plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ')
Beachten Sie, dass die von der Funktion na. approx() ausgewählten Werte offenbar recht gut mit dem Trend der Daten übereinstimmen.
Zusätzliche Ressourcen
Die folgenden Tutorials bieten zusätzliche Informationen zum Umgang mit fehlenden Werten in R:
So finden und zählen Sie fehlende Werte in R
Wie alle fehlenden Werte in R unterstellt werden
So verwenden Sie die Funktion is.na in R