Homocedasticidade
Este artigo explica o que é homocedasticidade nas estatísticas. Então, você encontrará a definição de homocedasticidade, quais as causas para um modelo de regressão não possuir homocedasticidade e mais, como consertar isso.
O que é homocedasticidade?
A homocedasticidade é uma característica de um modelo de regressão cujos erros das variáveis explicativas possuem variância constante. Ou seja, quando a variância do erro de um modelo de regressão é constante, o referido modelo apresenta homocedasticidade e, portanto, é um modelo homocedástico.
Vale lembrar que o erro (ou residual) é definido como a diferença entre o valor real e o valor estimado pelo modelo de regressão.
Ao executar um modelo de regressão, obteremos um valor diferente da expressão anterior para cada observação. Assim, um modelo estatístico homocedástico é aquele em que a variância dos erros calculados é constante ao longo das observações.
É importante que um modelo de regressão apresente homocedasticidade; na verdade, este é um dos pressupostos anteriores dos modelos de regressão. Se os resíduos não forem homocedásticos, é melhor refazer o modelo de outra forma para obter homocedasticidade. Caso contrário, a estimativa dos coeficientes de regressão provavelmente será errônea e erros nos testes de hipóteses também ocorrerão ao aceitar hipóteses nulas que deveriam na verdade ser rejeitadas.
Causas da falta de homocedasticidade
As causas mais comuns pelas quais um modelo não possui homocedasticidade são:
- Quando o intervalo de dados é muito amplo em comparação com a média. Se numa mesma amostra estatística existirem valores muito grandes e valores muito pequenos, é provável que o modelo de regressão obtido não seja homocedástico.
- A omissão de variáveis no modelo de regressão também resulta na falta de homocedasticidade. Logicamente, caso uma variável relevante não seja incluída no modelo, sua variação será incluída nos resíduos e não necessariamente será fixa.
- Uma mudança na estrutura pode produzir um mau ajuste do modelo ao conjunto de dados e, portanto, a variância dos resíduos não é constante.
- Quando algumas variáveis possuem valores muito maiores que as demais variáveis explicativas, o modelo pode não apresentar homocedasticidade. Neste caso, as variáveis podem ser relativizadas para resolver o problema.
No entanto, existem alguns casos que são inerentemente difíceis de apresentar como homocedasticidade. Por exemplo, se modelarmos o rendimento de uma pessoa com as suas despesas alimentares, as pessoas mais ricas têm uma variabilidade muito maior nas suas despesas alimentares do que as pessoas mais pobres. Porque uma pessoa rica às vezes come em restaurantes caros e outras vezes em restaurantes baratos, ao contrário de uma pessoa pobre que sempre come em restaurantes baratos. Portanto, é difícil conseguir homocedasticidade no modelo de regressão.
Corrigindo dados para alcançar homocedasticidade
Quando o modelo de regressão obtido não é homocedástico, podem ser tentadas as seguintes correções para alcançar a homocedasticidade:
- Calcule o logaritmo natural da variável independente, geralmente útil quando a variância dos resíduos aumenta no gráfico.
- Dependendo do gráfico residual, outro tipo de transformação da variável independente pode ser mais prático. Por exemplo, se o gráfico tiver a forma de uma parábola, podemos calcular o quadrado da variável independente e adicionar essa variável ao modelo.
- Outras variáveis também podem ser utilizadas para o modelo; removendo ou adicionando uma variável, a variância dos resíduos pode ser modificada.
- Em vez de usar o critério dos mínimos quadrados, pode ser usado o critério dos mínimos quadrados ponderados.
Homocedasticidade e heterocedasticidade
Por fim, veremos qual a diferença entre homocedasticidade e heterocedasticidade, visto que são dois importantes conceitos estatísticos de modelos de regressão.
A heterocedasticidade é uma característica estatística que implica que os resíduos do modelo de regressão não possuem variância constante, de modo que a variabilidade dos erros não é a mesma ao longo do gráfico.
A diferença entre homocedasticidade e heterocedasticidade é a constância da variância do erro. A homocedasticidade implica que a variância do erro é constante, enquanto a heterocedasticidade implica que a variância do erro não é constante.