Como interpolar valores ausentes em r (incluindo um exemplo)


Você pode usar a seguinte sintaxe básica para interpolar valores ausentes em uma coluna do quadro de dados em R:

 library (dplyr)
library (zoo)

df <- df %>%
        mutate(column_name = na. approx (column_name))

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: interpolar valores ausentes em R

Suponha que temos o seguinte quadro de dados em R que mostra o total de vendas realizadas por uma loja durante 15 dias consecutivos:

 #create data frame
df <- data. frame (day=1:15,
                 sales=c(3, 6, 8, 10, 14, 17, 20, NA, NA, NA, NA, 35, 39, 44, 49))

#view data frame
df

   day sales
1 1 3
2 2 6
3 3 8
4 4 10
5 5 14
6 6 17
7 7 20
8 8 NA
9 9 NA
10 10 NA
11 11 NA
12 12 35
13 13 39
14 14 44
15 15 49

Observe que faltam números de vendas de quatro dias no quadro de dados.

Se criássemos um gráfico de linhas simples para visualizar as vendas ao longo do tempo, seria assim:

 #create line chart to visualize sales
plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ') 

interpolar valores ausentes em R

Para preencher os valores ausentes, podemos usar a função na.approx() do pacote zoo , bem como a função mutate() do pacote dplyr :

 library (dplyr)
library (zoo)

#interpolate missing values in 'sales' column
df <- df %>%
        mutate(sales = na. approx (sales))

#view updated data frame
df

   day sales
1 1 3
2 2 6
3 3 8
4 4 10
5 5 14
6 6 17
7 7 20
8 8 23
9 9 26
10 10 29
11 11 32
12 12 35
13 13 39
14 14 44
15 15 49

Observe que cada um dos valores ausentes foi substituído.

Se criarmos outro gráfico de linhas para visualizar o quadro de dados atualizado, seria assim:

 #create line chart to visualize sales
plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ') 

Observe que os valores escolhidos pela função na.approx() parecem corresponder muito bem à tendência dos dados.

Recursos adicionais

Os tutoriais a seguir fornecem informações adicionais sobre como lidar com valores ausentes em R:

Como encontrar e contar valores ausentes em R
Como imputar todos os valores ausentes em R
Como usar a função is.na em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *