Как выполнить тест бреуша-пагана в sas
Тест Бреуша-Пэгана используется для определения наличия гетероскедастичности в регрессионном анализе.
В этом руководстве объясняется, как выполнить тест Бреуша-Пэгана в SAS.
Пример: тест Бреуша-Пагана в SAS.
Предположим, мы хотим подогнать модель множественной линейной регрессии, которая использует количество часов, потраченных на обучение, и количество сданных практических экзаменов для прогнозирования итоговой оценки студента на экзамене:
Оценка экзамена = β 0 + β 1 (часы) + β 2 (подготовительные экзамены)
Сначала мы будем использовать следующий код, чтобы создать набор данных, содержащий эту информацию для 20 студентов:
/*create dataset*/ data exam_data; input hours prep_exams score; datalines ; 1 1 76 2 3 78 2 3 85 4 5 88 2 2 72 1 2 69 5 1 94 4 1 94 2 0 88 4 3 92 4 4 90 3 3 75 6 2 90 5 4 90 3 4 82 4 4 85 6 5 90 2 1 83 1 0 62 2 1 76 ; run ; /*view dataset*/ proc print data =exam_data;
Далее мы будем использовать модель proc, чтобы соответствовать этой модели множественной линейной регрессии, а также оператор Pagan для выполнения теста Бреуша-Пэгана на гетероскедастичность:
/*fit regression model and perform Breusch Pagan test*/
proc model data =exam_data;
parms a1 b1 b2;
score = a1 + b1*hours + b2*prep_exams;
fit score / pagan=(1 hours prep_exams)
out =resid1 outsid ;
run ;
quit ;
В последней таблице результатов показаны результаты теста Бреуша-Пагана.
Из этой таблицы мы видим, что статистика теста равна 5,05 , а соответствующее значение p — 0,0803 .
Поскольку значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.
Это означает, что у нас нет достаточных доказательств, чтобы утверждать, что гетероскедастичность присутствует в регрессионной модели.
Таким образом, можно безопасно интерпретировать стандартные ошибки оценок коэффициентов в сводной таблице регрессии.
Что делать дальше
Если вам не удастся отвергнуть нулевую гипотезу теста Бреуша-Пэгана, то гетероскедастичности нет и вы можете приступить к интерпретации результата исходной регрессии.
Однако если вы отклоните нулевую гипотезу, это означает, что в данных присутствует гетероскедастичность. В этом случае стандартные ошибки, отображаемые в выходной таблице регрессии, могут быть недостоверными.
Существует несколько распространенных способов решения этой проблемы, в том числе:
1. Преобразуйте переменную ответа. Вы можете попытаться выполнить преобразование переменной ответа.
Например, вы можете использовать переменную ответа журнала вместо исходной переменной ответа.
Как правило , регистрация переменной ответа является эффективным способом устранения гетероскедастичности.
Другое распространенное преобразование — использование квадратного корня из переменной ответа.
2. Используйте взвешенную регрессию. Этот тип регрессии присваивает вес каждой точке данных на основе дисперсии ее подобранного значения.
Это придает малый вес точкам данных с более высокими дисперсиями, уменьшая их остаточные квадраты.
Использование соответствующих весов может устранить проблему гетероскедастичности.