Como realizar um teste breusch-pagan no sas
Um teste de Breusch-Pagan é usado para determinar se a heterocedasticidade está presente em uma análise de regressão.
Este tutorial explica como realizar um teste Breusch-Pagan no SAS.
Exemplo: teste Breusch-Pagan no SAS
Suponha que queiramos ajustar um modelo de regressão linear múltipla que usa o número de horas gastas estudando e o número de exames práticos realizados para prever a nota do exame final dos alunos:
Nota do exame = β 0 + β 1 (horas) + β 2 (exames preparatórios)
Primeiro, usaremos o seguinte código para criar um conjunto de dados contendo essas informações para 20 alunos:
/*create dataset*/ data exam_data; input hours prep_exams score; datalines ; 1 1 76 2 3 78 2 3 85 4 5 88 2 2 72 1 2 69 5 1 94 4 1 94 2 0 88 4 3 92 4 4 90 3 3 75 6 2 90 5 4 90 3 4 82 4 4 85 6 5 90 2 1 83 1 0 62 2 1 76 ; run ; /*view dataset*/ proc print data =exam_data;
A seguir, usaremos o modelo proc para ajustar este modelo de regressão linear múltipla, bem como a declaração pagã para realizar o teste Breusch-Pagan para heterocedasticidade:
/*fit regression model and perform Breusch Pagan test*/
proc model data =exam_data;
parms a1 b1 b2;
score = a1 + b1*hours + b2*prep_exams;
fit score / pagan=(1 hours prep_exams)
out =resid1 outsid ;
run ;
quit ;
A última tabela de resultados mostra os resultados do teste Breusch-Pagan.
Nesta tabela podemos ver que a estatística de teste é 5,05 e o valor p correspondente é 0,0803 .
Como o valor p não é inferior a 0,05, não rejeitamos a hipótese nula.
Isto significa que não temos evidências suficientes para afirmar que a heterocedasticidade está presente no modelo de regressão.
É portanto possível interpretar com segurança os erros padrão das estimativas dos coeficientes na tabela de resumo da regressão.
O que fazer a seguir
Se você não rejeitar a hipótese nula do teste de Breusch-Pagan, então a heterocedasticidade não estará presente e você poderá interpretar o resultado da regressão original.
Porém, se você rejeitar a hipótese nula, significa que a heterocedasticidade está presente nos dados. Neste caso, os erros padrão exibidos na tabela de resultados da regressão podem não ser confiáveis.
Existem várias maneiras comuns de resolver esse problema, incluindo:
1. Transforme a variável de resposta. Você pode tentar realizar uma transformação na variável de resposta.
Por exemplo, você pode usar a variável de resposta de log em vez da variável de resposta original.
Geralmente , obter o log da variável de resposta é uma forma eficaz de remover a heterocedasticidade.
Outra transformação comum é usar a raiz quadrada da variável de resposta.
2. Use regressão ponderada. Este tipo de regressão atribui um peso a cada ponto de dados com base na variância do seu valor ajustado.
Isso atribui pesos pequenos aos pontos de dados que possuem variâncias mais altas, reduzindo seus quadrados residuais.
Quando os pesos apropriados são usados, isso pode eliminar o problema da heterocedasticidade.