So interpolieren sie fehlende werte in r (einschließlich eines beispiels)


Sie können die folgende grundlegende Syntax verwenden, um fehlende Werte in einer Datenrahmenspalte in R zu interpolieren:

 library (dplyr)
library (zoo)

df <- df %>%
        mutate(column_name = na. approx (column_name))

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Fehlende Werte in R interpolieren

Angenommen, wir haben den folgenden Datenrahmen in R, der die Gesamtverkäufe eines Geschäfts an 15 aufeinanderfolgenden Tagen zeigt:

 #create data frame
df <- data. frame (day=1:15,
                 sales=c(3, 6, 8, 10, 14, 17, 20, NA, NA, NA, NA, 35, 39, 44, 49))

#view data frame
df

   day sales
1 1 3
2 2 6
3 3 8
4 4 10
5 5 14
6 6 17
7 7 20
8 8 NA
9 9 NA
10 10 NA
11 11 NA
12 12 35
13 13 39
14 14 44
15 15 49

Beachten Sie, dass uns im Datenrahmen Verkaufszahlen für vier Tage fehlen.

Wenn wir ein einfaches Liniendiagramm erstellen würden, um Verkäufe im Zeitverlauf zu visualisieren, würde es so aussehen:

 #create line chart to visualize sales
plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ') 

fehlende Werte in R interpolieren

Um die fehlenden Werte zu ergänzen, können wir die Funktion na. approx() aus dem Paket zoo sowie die Funktion mutate() aus dem Paket dplyr verwenden:

 library (dplyr)
library (zoo)

#interpolate missing values in 'sales' column
df <- df %>%
        mutate(sales = na. approx (sales))

#view updated data frame
df

   day sales
1 1 3
2 2 6
3 3 8
4 4 10
5 5 14
6 6 17
7 7 20
8 8 23
9 9 26
10 10 29
11 11 32
12 12 35
13 13 39
14 14 44
15 15 49

Beachten Sie, dass jeder der fehlenden Werte ersetzt wurde.

Wenn wir ein weiteres Liniendiagramm erstellen, um den aktualisierten Datenrahmen zu visualisieren, würde es so aussehen:

 #create line chart to visualize sales
plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ') 

Beachten Sie, dass die von der Funktion na. approx() ausgewählten Werte offenbar recht gut mit dem Trend der Daten übereinstimmen.

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zum Umgang mit fehlenden Werten in R:

So finden und zählen Sie fehlende Werte in R
Wie alle fehlenden Werte in R unterstellt werden
So verwenden Sie die Funktion is.na in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert