Como criar um gráfico residual em r
Os gráficos de resíduos são frequentemente usados para avaliar se os resíduos de uma análise de regressão são normalmente distribuídos e se apresentam ou não heterocedasticidade .
Este tutorial explica como criar gráficos residuais para um modelo de regressão em R.
Exemplo: gráficos residuais em R
Neste exemplo, ajustaremos um modelo de regressão usando o conjunto de dados R integrado mtcars e, em seguida, produziremos três gráficos de resíduos diferentes para analisar os resíduos.
Etapa 1: ajuste o modelo de regressão.
Primeiro, ajustaremos um modelo de regressão usando mpg como variável de resposta e disp e hp como variáveis explicativas:
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #get list of residuals res <- resid(model)
Passo 2: Produza um gráfico residual ou ajustado.
A seguir, produziremos um gráfico residual/ajustado, útil para detectar visualmente a heterocedasticidade – por exemplo, uma mudança sistemática na distribuição de resíduos ao longo de um intervalo de valores.
#produce residual vs. fitted plot plot(fitted(model), res) #add a horizontal line at 0 abline(0,0)
O eixo x exibe os valores ajustados e o eixo y exibe os resíduos. No gráfico podemos ver que a distribuição dos resíduos tende a ser maior para valores ajustados mais elevados, mas isso não parece suficientemente grave para que precisemos fazer alterações no modelo.
Etapa 3: Produza um gráfico QQ.
Também podemos produzir um gráfico QQ, útil para determinar se os resíduos seguem uma distribuição normal. Se os valores dos dados no gráfico seguirem uma linha aproximadamente reta em um ângulo de 45 graus, os dados serão distribuídos normalmente.
#create QQ plot for residuals qqnorm(res) #add a straight diagonal line to the plot qqline(res)
Podemos observar que os resíduos tendem a se desviar um pouco da linha próxima às caudas, o que pode indicar que não estão normalmente distribuídos.
Etapa 4: Produza um gráfico de densidade.
Também podemos produzir um gráfico de densidade, que também é útil para verificar visualmente se os resíduos estão normalmente distribuídos ou não. Se o gráfico tiver aproximadamente a forma de um sino, os resíduos provavelmente seguem uma distribuição normal.
#Create density plot of residuals
plot(density(res))
Podemos ver que o gráfico de densidade segue aproximadamente o formato de um sino, embora esteja ligeiramente inclinado para a direita. Dependendo do tipo de estudo, um pesquisador pode ou não decidir realizar uma transformação nos dados para garantir que os resíduos sejam distribuídos de forma mais normal.
Recursos adicionais
Como calcular resíduos padronizados em R
Como calcular resíduos estudantis em R
Como criar um histograma de resíduos em R