Como realizar o teste goldfeld-quandt em r
O teste Goldfeld-Quandt é usado para determinar se a heterocedasticidade está presente em um modelo de regressão.
A heterocedasticidade refere-se à dispersão desigual de resíduos em diferentes níveis de uma variável resposta em um modelo de regressão.
Se a heterocedasticidade estiver presente, isso viola um dos principais pressupostos da regressão linear de que os resíduos estão igualmente dispersos em cada nível da variável de resposta.
Este tutorial fornece um exemplo passo a passo de como realizar o teste Goldfeld-Quandt em R para determinar se a heterocedasticidade está presente ou não em um determinado modelo de regressão.
Etapa 1: crie um modelo de regressão
Primeiro, criaremos um modelo de regressão linear múltipla usando o conjunto de dados mtcars integrado ao R:
#fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Passo 2: Realize o teste Goldfeld-Quandt
A seguir, usaremos a função gqtest() do pacote lmtest para realizar o teste Goldfeld-Quandt para determinar se a heterocedasticidade está presente.
Esta função usa a seguinte sintaxe:
gqtest(modelo, order.by, dados, fração)
Ouro:
- model: O modelo de regressão linear criado pelo comando lm().
- order.by: a(s) variável(is) preditiva(s) do modelo.
- dados: o nome do conjunto de dados.
- fração*: número de observações centrais a serem removidas do conjunto de dados.
*O teste Goldfeld-Quandt funciona removendo uma série de observações localizadas no centro do conjunto de dados e depois testando para ver se a distribuição dos resíduos é diferente dos dois conjuntos de dados resultantes que ficam em ambos os lados dos conjuntos de dados. observações centrais.
Normalmente, optamos por remover cerca de 20% do total de observações. Neste caso, mtcars tem 32 observações no total, então podemos optar por remover as 7 observações centrais:
#load lmtest library library(lmtest) #perform the Goldfeld Quandt test gqtest(model, order.by = ~disp+hp, data = mtcars, fraction = 7) Goldfeld-Quandt test data: model GQ = 1.0316, df1 = 10, df2 = 9, p-value = 0.486 alternative hypothesis: variance increases from segment 1 to 2
Veja como interpretar o resultado:
- A estatística de teste é 1,0316 .
- O valor p correspondente é 0,486 .
O teste Goldfeld-Quandt utiliza as seguintes hipóteses nulas e alternativas:
- Nulo (H 0 ) : A homocedasticidade está presente.
- Alternativa ( HA ): A heterocedasticidade está presente.
Como o valor p não é inferior a 0,05, não rejeitamos a hipótese nula. Não temos evidências suficientes para afirmar que a heterocedasticidade está presente no modelo de regressão.
O que fazer a seguir
Se você não rejeitar a hipótese nula do teste Goldfeld-Quandt, então a heterocedasticidade não estará presente e você poderá prosseguir para interpretar o resultado da regressão original.
Porém, se você rejeitar a hipótese nula, significa que a heterocedasticidade está presente nos dados. Neste caso, os erros padrão exibidos na tabela de resultados da regressão podem não ser confiáveis.
Existem várias maneiras comuns de resolver esse problema, incluindo:
1. Transforme a variável de resposta.
Você pode tentar realizar uma transformação na variável de resposta, por exemplo, obtendo o log, a raiz quadrada ou a raiz cúbica da variável de resposta. Geralmente, isso pode fazer com que a heterocedasticidade desapareça.
2. Use regressão ponderada.
A regressão ponderada atribui um peso a cada ponto de dados com base na variância do seu valor ajustado. Essencialmente, isso atribui pesos baixos aos pontos de dados que possuem variâncias mais altas, reduzindo seus quadrados residuais.
Quando os pesos apropriados são usados, a regressão ponderada pode eliminar o problema da heterocedasticidade.
Recursos adicionais
Como realizar regressão linear múltipla em R
Como realizar o teste de White em R
Como realizar um teste de Breusch-Pagan em R