Como realizar um teste de breusch-pagan em r
Um teste de Breusch-Pagan é usado para determinar se a heterocedasticidade está presente em uma análise de regressão.
Este tutorial explica como realizar um teste de Breusch-Pagan em R.
Exemplo: teste Breusch-Pagan em R
Neste exemplo, ajustaremos um modelo de regressão usando o conjunto de dados R integrado mtcars e, em seguida, realizaremos um teste Breusch-Pagan usando a função bptest da biblioteca lmtest para determinar se a heterocedasticidade está presente.
Etapa 1: ajuste um modelo de regressão.
Primeiro, ajustaremos um modelo de regressão usando mpg como variável de resposta e disp e hp como duas variáveis explicativas.
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Etapa 2: execute um teste de Breusch-Pagan.
A seguir, realizaremos um teste de Breusch-Pagan para determinar se a heterocedasticidade está presente.
#load lmtest library library(lmtest) #perform Breusch-Pagan Test bptest(model) studentized Breusch-Pagan test data: model BP = 4.0861, df = 2, p-value = 0.1296
A estatística de teste é 4,0861 e o valor p correspondente é 0,1296 . Como o valor p não é inferior a 0,05, não rejeitamos a hipótese nula. Não temos evidências suficientes para afirmar que a heterocedasticidade está presente no modelo de regressão.
O que fazer a seguir
Se você não rejeitar a hipótese nula do teste de Breusch-Pagan, então a heterocedasticidade não estará presente e você poderá interpretar o resultado da regressão original.
Porém, se você rejeitar a hipótese nula, significa que a heterocedasticidade está presente nos dados. Neste caso, os erros padrão exibidos na tabela de resultados da regressão podem não ser confiáveis.
Existem várias maneiras comuns de resolver esse problema, incluindo:
1. Transforme a variável de resposta. Você pode tentar realizar uma transformação na variável de resposta. Por exemplo, você pode usar a variável de resposta de log em vez da variável de resposta original. Geralmente, obter o logaritmo da variável de resposta é uma forma eficaz de eliminar a heterocedasticidade. Outra transformação comum é usar a raiz quadrada da variável de resposta.
2. Use regressão ponderada. Este tipo de regressão atribui um peso a cada ponto de dados com base na variância do seu valor ajustado. Essencialmente, isso atribui pesos baixos aos pontos de dados que possuem variâncias mais altas, reduzindo seus quadrados residuais. Quando os pesos apropriados são usados, isso pode eliminar o problema da heterocedasticidade.