Como realizar o teste goldfeld-quandt em r


O teste Goldfeld-Quandt é usado para determinar se a heterocedasticidade está presente em um modelo de regressão.

A heterocedasticidade refere-se à dispersão desigual de resíduos em diferentes níveis de uma variável resposta em um modelo de regressão.

Se a heterocedasticidade estiver presente, isso viola um dos principais pressupostos da regressão linear de que os resíduos estão igualmente dispersos em cada nível da variável de resposta.

Este tutorial fornece um exemplo passo a passo de como realizar o teste Goldfeld-Quandt em R para determinar se a heterocedasticidade está presente ou não em um determinado modelo de regressão.

Etapa 1: crie um modelo de regressão

Primeiro, criaremos um modelo de regressão linear múltipla usando o conjunto de dados mtcars integrado ao R:

 #fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Passo 2: Realize o teste Goldfeld-Quandt

A seguir, usaremos a função gqtest() do pacote lmtest para realizar o teste Goldfeld-Quandt para determinar se a heterocedasticidade está presente.

Esta função usa a seguinte sintaxe:

gqtest(modelo, order.by, dados, fração)

Ouro:

  • model: O modelo de regressão linear criado pelo comando lm().
  • order.by: a(s) variável(is) preditiva(s) do modelo.
  • dados: o nome do conjunto de dados.
  • fração*: número de observações centrais a serem removidas do conjunto de dados.

*O teste Goldfeld-Quandt funciona removendo uma série de observações localizadas no centro do conjunto de dados e depois testando para ver se a distribuição dos resíduos é diferente dos dois conjuntos de dados resultantes que ficam em ambos os lados dos conjuntos de dados. observações centrais.

Normalmente, optamos por remover cerca de 20% do total de observações. Neste caso, mtcars tem 32 observações no total, então podemos optar por remover as 7 observações centrais:

 #load lmtest library
library(lmtest)

#perform the Goldfeld Quandt test
gqtest(model, order.by = ~disp+hp, data = mtcars, fraction = 7)

	Goldfeld-Quandt test

data: model
GQ = 1.0316, df1 = 10, df2 = 9, p-value = 0.486
alternative hypothesis: variance increases from segment 1 to 2

Veja como interpretar o resultado:

  • A estatística de teste é 1,0316 .
  • O valor p correspondente é 0,486 .

O teste Goldfeld-Quandt utiliza as seguintes hipóteses nulas e alternativas:

  • Nulo (H 0 ) : A homocedasticidade está presente.
  • Alternativa ( HA ): A heterocedasticidade está presente.

Como o valor p não é inferior a 0,05, não rejeitamos a hipótese nula. Não temos evidências suficientes para afirmar que a heterocedasticidade está presente no modelo de regressão.

O que fazer a seguir

Se você não rejeitar a hipótese nula do teste Goldfeld-Quandt, então a heterocedasticidade não estará presente e você poderá prosseguir para interpretar o resultado da regressão original.

Porém, se você rejeitar a hipótese nula, significa que a heterocedasticidade está presente nos dados. Neste caso, os erros padrão exibidos na tabela de resultados da regressão podem não ser confiáveis.

Existem várias maneiras comuns de resolver esse problema, incluindo:

1. Transforme a variável de resposta.

Você pode tentar realizar uma transformação na variável de resposta, por exemplo, obtendo o log, a raiz quadrada ou a raiz cúbica da variável de resposta. Geralmente, isso pode fazer com que a heterocedasticidade desapareça.

2. Use regressão ponderada.

A regressão ponderada atribui um peso a cada ponto de dados com base na variância do seu valor ajustado. Essencialmente, isso atribui pesos baixos aos pontos de dados que possuem variâncias mais altas, reduzindo seus quadrados residuais.

Quando os pesos apropriados são usados, a regressão ponderada pode eliminar o problema da heterocedasticidade.

Recursos adicionais

Como realizar regressão linear múltipla em R
Como realizar o teste de White em R
Como realizar um teste de Breusch-Pagan em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *