Como criar um gráfico residual em r


Os gráficos de resíduos são frequentemente usados para avaliar se os resíduos de uma análise de regressão são normalmente distribuídos e se apresentam ou não heterocedasticidade .

Este tutorial explica como criar gráficos residuais para um modelo de regressão em R.

Exemplo: gráficos residuais em R

Neste exemplo, ajustaremos um modelo de regressão usando o conjunto de dados R integrado mtcars e, em seguida, produziremos três gráficos de resíduos diferentes para analisar os resíduos.

Etapa 1: ajuste o modelo de regressão.

Primeiro, ajustaremos um modelo de regressão usando mpg como variável de resposta e disp e hp como variáveis explicativas:

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

Passo 2: Produza um gráfico residual ou ajustado.

A seguir, produziremos um gráfico residual/ajustado, útil para detectar visualmente a heterocedasticidade – por exemplo, uma mudança sistemática na distribuição de resíduos ao longo de um intervalo de valores.

 #produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

Terreno residual ou ajustado em R

O eixo x exibe os valores ajustados e o eixo y exibe os resíduos. No gráfico podemos ver que a distribuição dos resíduos tende a ser maior para valores ajustados mais elevados, mas isso não parece suficientemente grave para que precisemos fazer alterações no modelo.

Etapa 3: Produza um gráfico QQ.

Também podemos produzir um gráfico QQ, útil para determinar se os resíduos seguem uma distribuição normal. Se os valores dos dados no gráfico seguirem uma linha aproximadamente reta em um ângulo de 45 graus, os dados serão distribuídos normalmente.

 #create QQ plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

Gráfico QQ residual em R

Podemos observar que os resíduos tendem a se desviar um pouco da linha próxima às caudas, o que pode indicar que não estão normalmente distribuídos.

Etapa 4: Produza um gráfico de densidade.

Também podemos produzir um gráfico de densidade, que também é útil para verificar visualmente se os resíduos estão normalmente distribuídos ou não. Se o gráfico tiver aproximadamente a forma de um sino, os resíduos provavelmente seguem uma distribuição normal.

 #Create density plot of residuals
plot(density(res))

Curva de densidade residual em R

Podemos ver que o gráfico de densidade segue aproximadamente o formato de um sino, embora esteja ligeiramente inclinado para a direita. Dependendo do tipo de estudo, um pesquisador pode ou não decidir realizar uma transformação nos dados para garantir que os resíduos sejam distribuídos de forma mais normal.

Recursos adicionais

Como calcular resíduos padronizados em R
Como calcular resíduos estudantis em R
Como criar um histograma de resíduos em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *