O que é considerado um gráfico residual bom ou ruim?
Na análise de regressão, um gráfico de resíduos é um tipo de gráfico que exibe os valores ajustados de um modelo de regressão no eixo xe os resíduos do modelo ao longo do eixo y.
Ao inspecionar visualmente um layout residual, geralmente procuramos duas coisas para determinar se o layout é “bom” ou “ruim”:
1. Os resíduos mostram uma tendência clara?
- Num gráfico de resíduos “bom”, os resíduos não mostram uma tendência clara.
- Em um gráfico de resíduos “ruim”, os resíduos apresentam algum tipo de padrão, como uma curva ou onda. Isso indica que o modelo de regressão que utilizamos não fornece um ajuste adequado aos dados.
2. Os resíduos aumentam ou diminuem a variância sistematicamente?
- Em um gráfico de resíduos “bom”, os resíduos são espalhados aleatoriamente em torno de zero, sem um aumento ou diminuição sistemático na variância.
- Num gráfico de resíduos “ruim”, a variância dos resíduos aumenta ou diminui sistematicamente.
Se um gráfico residual for classificado como “bom”, significa que podemos confiar nos resultados do modelo de regressão e que é seguro interpretar os coeficientes do modelo.
No entanto, se um gráfico residual for classificado como “ruim”, significa que os resultados do modelo não são confiáveis e precisamos ajustar um modelo de regressão diferente aos dados.
Os exemplos a seguir explicam como interpretar gráficos de resíduos “bons” e “ruins” na prática.
Exemplo 1: um traço residual “bom”
Suponha que ajustamos um modelo de regressão e obtemos o seguinte gráfico residual:

Podemos responder às duas perguntas a seguir para determinar se este é um gráfico residual “bom”:
1. Os resíduos mostram uma tendência clara?
Não. Os resíduos estão espalhados aleatoriamente em torno de zero, sem um padrão claro.
2. Os resíduos aumentam ou diminuem a variância sistematicamente?
Não. Os resíduos têm uma variância bastante constante (isto é, a distância entre os resíduos e o valor zero) em cada nível dos valores ajustados.
Como respondemos “Não” a ambas as perguntas, consideraríamos este um “bom” gráfico residual.
Portanto, podemos confiar nos resultados do modelo de regressão e interpretar os coeficientes do modelo com segurança.
Exemplo 2: um gráfico residual “ruim” com um modelo claro
Suponha que ajustamos um modelo de regressão e obtemos o seguinte gráfico residual:

Podemos responder às duas perguntas a seguir para determinar se este é um gráfico residual “bom”:
1. Os resíduos mostram uma tendência clara?
Sim . Os resíduos mostram um padrão curvo.
2. Os resíduos aumentam ou diminuem a variância sistematicamente?
Sim . Os resíduos têm diferentes níveis de variância em diferentes níveis dos valores ajustados.
Como respondemos “Sim” a pelo menos uma dessas perguntas, consideraríamos este um gráfico residual “ruim”.
Isto significa que o modelo de regressão não proporciona um bom ajuste aos dados.
Em particular, o padrão curvo no gráfico de resíduos indica que um modelo de regressão linear não consegue ajustar os dados e que um modelo de regressão quadrática provavelmente faria um trabalho melhor.
Exemplo 3: um gráfico residual “ruim” com variância crescente
Suponha que ajustamos um modelo de regressão e obtemos o seguinte gráfico residual:

Podemos responder às duas perguntas a seguir para determinar se este é um gráfico residual “bom”:
1. Os resíduos mostram uma tendência clara?
Não. Não há uma tendência clara nos resíduos.
2. Os resíduos aumentam ou diminuem a variância sistematicamente?
Sim . A variância dos resíduos aumenta à medida que os valores ajustados aumentam.
Como respondemos “Sim” a pelo menos uma dessas perguntas, consideraríamos este um gráfico residual “ruim”.
Neste exemplo específico, os resíduos sofrem de heterocedasticidade , que se refere à variância desigual dos resíduos em diferentes níveis dos valores ajustados.
Isto significa que os resultados do modelo de regressão podem não ser fiáveis.
Consulte este artigo para aprender diferentes maneiras de resolver o problema de heterocedasticidade em um modelo de regressão.
Recursos adicionais
Os tutoriais a seguir explicam como criar gráficos residuais usando diferentes softwares estatísticos:
Como criar um gráfico residual em R
Como criar um gráfico residual em Python
Como criar um gráfico residual no Excel
Como criar um gráfico residual no SAS