Como realizar o teste de white em r (com exemplos)
O teste de White é usado para determinar se a heterocedasticidade está presente em um modelo de regressão.
A heterocedasticidade refere-se à dispersão desigual de resíduos em diferentes níveis de uma variável de resposta em um modelo de regressão, o que viola uma das principais suposições da regressão linear de que os resíduos são igualmente dispersos em cada nível da variável de resposta.
Este tutorial explica como realizar o teste de White em R para determinar se a heterocedasticidade é ou não um problema em um determinado modelo de regressão.
Exemplo: teste branco em R
Neste exemplo, ajustaremos um modelo de regressão linear múltipla usando o conjunto de dados R integrado mtcars.
Depois de ajustar o modelo, usaremos a função bptest da biblioteca lmtest para realizar o teste de White para determinar se a heterocedasticidade está presente.
Etapa 1: ajuste um modelo de regressão.
Primeiro, ajustaremos um modelo de regressão usando mpg como variável de resposta e disp e hp como duas variáveis explicativas.
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Etapa 2: execute o teste de White.
A seguir, usaremos a seguinte sintaxe para realizar o teste de White para determinar se a heterocedasticidade está presente:
#load lmtest library library(lmtest) #perform White's test bptest(model, ~ disp*hp + I(disp^2) + I(hp^2), data = mtcars) studentized Breusch-Pagan test data: model BP = 7.0766, df = 5, p-value = 0.215
Veja como interpretar o resultado:
- A estatística de teste é X2 = 7,0766 .
- Os graus de liberdade são 5 .
- O valor p correspondente é 0,215 .
O teste de White utiliza as seguintes hipóteses nulas e alternativas:
- Nulo (H 0 ) : A homocedasticidade está presente.
- Alternativa ( HA ): A heterocedasticidade está presente.
Como o valor p não é inferior a 0,05, não rejeitamos a hipótese nula. Não temos evidências suficientes para afirmar que a heterocedasticidade está presente no modelo de regressão.
O que fazer a seguir
Se você não rejeitar a hipótese nula do teste de White, então a heterocedasticidade não estará presente e você poderá interpretar o resultado da regressão original.
Porém, se você rejeitar a hipótese nula, significa que a heterocedasticidade está presente nos dados. Neste caso, os erros padrão exibidos na tabela de resultados da regressão podem não ser confiáveis.
Existem várias maneiras comuns de resolver esse problema, incluindo:
1. Transforme a variável de resposta.
Você pode tentar realizar uma transformação na variável de resposta, por exemplo, obtendo o log, a raiz quadrada ou a raiz cúbica da variável de resposta. Geralmente, isso pode fazer com que a heterocedasticidade desapareça.
2. Use regressão ponderada.
A regressão ponderada atribui um peso a cada ponto de dados com base na variância do seu valor ajustado. Essencialmente, isso atribui pesos baixos aos pontos de dados que possuem variâncias mais altas, reduzindo seus quadrados residuais. Quando os pesos apropriados são usados, isso pode eliminar o problema da heterocedasticidade.