Como realizar o teste de white em r (com exemplos)


O teste de White é usado para determinar se a heterocedasticidade está presente em um modelo de regressão.

A heterocedasticidade refere-se à dispersão desigual de resíduos em diferentes níveis de uma variável de resposta em um modelo de regressão, o que viola uma das principais suposições da regressão linear de que os resíduos são igualmente dispersos em cada nível da variável de resposta.

Este tutorial explica como realizar o teste de White em R para determinar se a heterocedasticidade é ou não um problema em um determinado modelo de regressão.

Exemplo: teste branco em R

Neste exemplo, ajustaremos um modelo de regressão linear múltipla usando o conjunto de dados R integrado mtcars.

Depois de ajustar o modelo, usaremos a função bptest da biblioteca lmtest para realizar o teste de White para determinar se a heterocedasticidade está presente.

Etapa 1: ajuste um modelo de regressão.

Primeiro, ajustaremos um modelo de regressão usando mpg como variável de resposta e disp e hp como duas variáveis explicativas.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Etapa 2: execute o teste de White.

A seguir, usaremos a seguinte sintaxe para realizar o teste de White para determinar se a heterocedasticidade está presente:

 #load lmtest library
library(lmtest)

#perform White's test
bptest(model, ~ disp*hp + I(disp^2) + I(hp^2), data = mtcars)

	studentized Breusch-Pagan test

data: model
BP = 7.0766, df = 5, p-value = 0.215

Veja como interpretar o resultado:

  • A estatística de teste é X2 = 7,0766 .
  • Os graus de liberdade são 5 .
  • O valor p correspondente é 0,215 .

O teste de White utiliza as seguintes hipóteses nulas e alternativas:

  • Nulo (H 0 ) : A homocedasticidade está presente.
  • Alternativa ( HA ): A heterocedasticidade está presente.

Como o valor p não é inferior a 0,05, não rejeitamos a hipótese nula. Não temos evidências suficientes para afirmar que a heterocedasticidade está presente no modelo de regressão.

O que fazer a seguir

Se você não rejeitar a hipótese nula do teste de White, então a heterocedasticidade não estará presente e você poderá interpretar o resultado da regressão original.

Porém, se você rejeitar a hipótese nula, significa que a heterocedasticidade está presente nos dados. Neste caso, os erros padrão exibidos na tabela de resultados da regressão podem não ser confiáveis.

Existem várias maneiras comuns de resolver esse problema, incluindo:

1. Transforme a variável de resposta.

Você pode tentar realizar uma transformação na variável de resposta, por exemplo, obtendo o log, a raiz quadrada ou a raiz cúbica da variável de resposta. Geralmente, isso pode fazer com que a heterocedasticidade desapareça.

2. Use regressão ponderada.

A regressão ponderada atribui um peso a cada ponto de dados com base na variância do seu valor ajustado. Essencialmente, isso atribui pesos baixos aos pontos de dados que possuem variâncias mais altas, reduzindo seus quadrados residuais. Quando os pesos apropriados são usados, isso pode eliminar o problema da heterocedasticidade.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *