Como interpolar valores ausentes em r (incluindo um exemplo)
Você pode usar a seguinte sintaxe básica para interpolar valores ausentes em uma coluna do quadro de dados em R:
library (dplyr) library (zoo) df <- df %>% mutate(column_name = na. approx (column_name))
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: interpolar valores ausentes em R
Suponha que temos o seguinte quadro de dados em R que mostra o total de vendas realizadas por uma loja durante 15 dias consecutivos:
#create data frame df <- data. frame (day=1:15, sales=c(3, 6, 8, 10, 14, 17, 20, NA, NA, NA, NA, 35, 39, 44, 49)) #view data frame df day sales 1 1 3 2 2 6 3 3 8 4 4 10 5 5 14 6 6 17 7 7 20 8 8 NA 9 9 NA 10 10 NA 11 11 NA 12 12 35 13 13 39 14 14 44 15 15 49
Observe que faltam números de vendas de quatro dias no quadro de dados.
Se criássemos um gráfico de linhas simples para visualizar as vendas ao longo do tempo, seria assim:
#create line chart to visualize sales plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ')
Para preencher os valores ausentes, podemos usar a função na.approx() do pacote zoo , bem como a função mutate() do pacote dplyr :
library (dplyr) library (zoo) #interpolate missing values in 'sales' column df <- df %>% mutate(sales = na. approx (sales)) #view updated data frame df day sales 1 1 3 2 2 6 3 3 8 4 4 10 5 5 14 6 6 17 7 7 20 8 8 23 9 9 26 10 10 29 11 11 32 12 12 35 13 13 39 14 14 44 15 15 49
Observe que cada um dos valores ausentes foi substituído.
Se criarmos outro gráfico de linhas para visualizar o quadro de dados atualizado, seria assim:
#create line chart to visualize sales plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ')
Observe que os valores escolhidos pela função na.approx() parecem corresponder muito bem à tendência dos dados.
Recursos adicionais
Os tutoriais a seguir fornecem informações adicionais sobre como lidar com valores ausentes em R:
Como encontrar e contar valores ausentes em R
Como imputar todos os valores ausentes em R
Como usar a função is.na em R