Como usar erros padrão robustos em regressão no stata


A regressão linear múltipla é um método que podemos usar para compreender a relação entre múltiplas variáveis explicativas e uma variável de resposta.

Infelizmente, um problema que ocorre frequentemente na regressão é conhecido como heterocedasticidade , no qual há uma mudança sistemática na variância dos resíduos ao longo de um intervalo de valores medidos.

Isto leva a um aumento na variância das estimativas dos coeficientes de regressão, mas o modelo de regressão não leva isso em consideração. Isto torna muito mais provável que um modelo de regressão afirme que um termo do modelo é estatisticamente significativo, quando na realidade não o é.

Uma forma de explicar este problema é usar erros padrão robustos , que são mais “robustos” para o problema da heterocedasticidade e tendem a fornecer uma medida mais precisa do verdadeiro erro padrão de um coeficiente de regressão.

Este tutorial explica como usar erros padrão robustos na análise de regressão no Stata.

Exemplo: erros padrão robustos no Stata

Usaremos o conjunto de dados Stata integrado automaticamente para ilustrar como usar erros padrão robustos na regressão.

Etapa 1: Carregar e exibir dados.

Primeiro, use o seguinte comando para carregar os dados:

uso automático do sistema

Em seguida, exiba os dados brutos usando o seguinte comando:

br

Conjunto de dados automático no Stata

Etapa 2: Execute a regressão linear múltipla sem erros padrão robustos.

A seguir, inseriremos o seguinte comando para realizar uma regressão linear múltipla usando preço como variável de resposta e mpg e peso como variáveis explicativas:

preço de regressão peso mpg

Saída de regressão múltipla no Stata

Etapa 3: Execute a regressão linear múltipla usando erros padrão robustos.

Agora realizaremos exatamente a mesma regressão linear múltipla, mas desta vez usaremos o comando vce(robust) para que o Stata saiba como usar erros padrão robustos:

preço de regressão peso mpg, vce (robusto)

Erros padrão robustos no Stata

Existem algumas coisas interessantes a serem observadas aqui:

1. As estimativas dos coeficientes permaneceram as mesmas . Quando usamos erros padrão robustos, as estimativas dos coeficientes não mudam em nada. Observe que as estimativas dos coeficientes para mpg, peso e constante são as seguintes para ambas as regressões:

  • mpg: -49,51222
  • peso: 1,746559
  • _contra: 1946.069

2. Os erros padrão mudaram . Observe que quando usamos erros padrão robustos, os erros padrão para cada uma das estimativas dos coeficientes aumentaram.

Nota: Na maioria dos casos, os erros padrão robustos serão maiores do que os erros padrão normais, mas em casos raros é possível que os erros padrão robustos sejam realmente menores.

3. A estatística de teste de cada coeficiente mudou. Observe que o valor absoluto de cada estatística de teste , t , diminuiu. Com efeito, a estatística de teste é calculada como o coeficiente estimado dividido pelo erro padrão. Assim, quanto maior o erro padrão, menor será o valor absoluto da estatística de teste.

4. Os valores p mudaram . Observe que os valores p de cada variável também aumentaram. Isso ocorre porque estatísticas de teste menores estão associadas a valores p maiores.

Embora os valores de p tenham mudado para nossos coeficientes, a variável mpg ainda não é estatisticamente significativa em α = 0,05 e o peso da variável ainda é estatisticamente significativo em α = 0,05.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *