Как выполнить тест бреуша-пагана в sas


Тест Бреуша-Пэгана используется для определения наличия гетероскедастичности в регрессионном анализе.

В этом руководстве объясняется, как выполнить тест Бреуша-Пэгана в SAS.

Пример: тест Бреуша-Пагана в SAS.

Предположим, мы хотим подогнать модель множественной линейной регрессии, которая использует количество часов, потраченных на обучение, и количество сданных практических экзаменов для прогнозирования итоговой оценки студента на экзамене:

Оценка экзамена = β 0 + β 1 (часы) + β 2 (подготовительные экзамены)

Сначала мы будем использовать следующий код, чтобы создать набор данных, содержащий эту информацию для 20 студентов:

 /*create dataset*/
data exam_data;
    input hours prep_exams score;
    datalines ;
1 1 76
2 3 78
2 3 85
4 5 88
2 2 72
1 2 69
5 1 94
4 1 94
2 0 88
4 3 92
4 4 90
3 3 75
6 2 90
5 4 90
3 4 82
4 4 85
6 5 90
2 1 83
1 0 62
2 1 76
;
run ;

/*view dataset*/
proc print data =exam_data; 

Далее мы будем использовать модель proc, чтобы соответствовать этой модели множественной линейной регрессии, а также оператор Pagan для выполнения теста Бреуша-Пэгана на гетероскедастичность:

 /*fit regression model and perform Breusch Pagan test*/
proc model data =exam_data;
    parms a1 b1 b2;
    score = a1 + b1*hours + b2*prep_exams;
    fit score / pagan=(1 hours prep_exams)
    out =resid1 outsid ;
run ;
quit ; 

Тест Бреуша-Пэгана в SAS

В последней таблице результатов показаны результаты теста Бреуша-Пагана.

Из этой таблицы мы видим, что статистика теста равна 5,05 , а соответствующее значение p — 0,0803 .

Поскольку значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что у нас нет достаточных доказательств, чтобы утверждать, что гетероскедастичность присутствует в регрессионной модели.

Таким образом, можно безопасно интерпретировать стандартные ошибки оценок коэффициентов в сводной таблице регрессии.

Что делать дальше

Если вам не удастся отвергнуть нулевую гипотезу теста Бреуша-Пэгана, то гетероскедастичности нет и вы можете приступить к интерпретации результата исходной регрессии.

Однако если вы отклоните нулевую гипотезу, это означает, что в данных присутствует гетероскедастичность. В этом случае стандартные ошибки, отображаемые в выходной таблице регрессии, могут быть недостоверными.

Существует несколько распространенных способов решения этой проблемы, в том числе:

1. Преобразуйте переменную ответа. Вы можете попытаться выполнить преобразование переменной ответа.

Например, вы можете использовать переменную ответа журнала вместо исходной переменной ответа.

Как правило , регистрация переменной ответа является эффективным способом устранения гетероскедастичности.

Другое распространенное преобразование — использование квадратного корня из переменной ответа.

2. Используйте взвешенную регрессию. Этот тип регрессии присваивает вес каждой точке данных на основе дисперсии ее подобранного значения.

Это придает малый вес точкам данных с более высокими дисперсиями, уменьшая их остаточные квадраты.

Использование соответствующих весов может устранить проблему гетероскедастичности.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *