Як розрахувати aic у sas (з прикладом)


Інформаційний критерій Akaike (AIC) — це метрика, яка використовується для порівняння відповідності множинних регресійних моделей.

Він розраховується таким чином:

AIC = 2K – 2 ln (L)

золото:

  • K: Кількість параметрів моделі. Значення K за замовчуванням дорівнює 2, тому модель лише з однією змінною предиктора матиме значення K 2+1 = 3.
  • ln (L) : логарифм правдоподібності моделі. Більшість статистичних програм можуть автоматично обчислити це значення для вас.

AIC розроблено, щоб знайти модель, яка пояснює найбільшу варіацію в даних, водночас штрафуючи моделі, які використовують надмірну кількість параметрів.

Після встановлення кількох регресійних моделей ви можете порівняти значення AIC кожної моделі. Чим нижче AIC, тим більше підходить модель.

У наступному прикладі показано, як обчислити AIC для різних моделей регресії в SAS.

Приклад: як розрахувати AIC у SAS

Припустімо, ми хочемо підібрати три різні моделі множинної лінійної регресії , щоб передбачити оцінку, яку студенти отримають на іспиті в класі.

Ось змінні предиктора, які ми будемо використовувати в кожній моделі:

  • Змінні предиктора в моделі 1: години, витрачені на навчання
  • Змінні предикторів у моделі 2: минулі практичні іспити
  • Прогностичні змінні в моделі 3: години, витрачені на навчання, і практичні іспити

Спочатку ми використаємо наступний код, щоб створити набір даних, що містить цю інформацію для 20 студентів:

 /*create dataset*/
data exam_data;
    input hours prep_exams score;
    datalines ;
1 1 76
2 3 78
2 3 85
4 5 88
2 2 72
1 2 69
5 1 94
4 1 94
2 0 88
4 3 92
4 4 90
3 3 75
6 2 96
5 4 90
3 4 82
4 4 85
6 5 99
2 1 83
1 0 62
2 1 76
;
run ;

Далі ми використаємо proc reg , щоб відповідати кожній із цих регресійних моделей, і використаємо оператор selection=adjrsq sse aic, щоб обчислити значення AIC для кожної моделі:

 /*fit multiple linear regression models and calculate AIC for each model*/
proc reg data =exam_data;
    model score = hours prep_exams / selection=adjrsq sse aic;
run ; 

розрахувати AIC в SAS

З результату ми можемо побачити значення AIC для кожної моделі:

  • AIC з годинами як змінною предиктора: 68,4537
  • AIC з годинами та іспитами як предикторними змінними: 69,9507
  • AIC з іспитами як прогностичною змінною: 91,4967

Модель з найнижчим значенням AIC – це та, яка містить лише години як змінну-прогноз.

Таким чином, ми заявляємо, що наступна модель найкраще відповідає даним:

Оцінка = β 0 + β 1 (вивчені години)

Коли ми визначимо цю модель як найкращу, ми зможемо підібрати її та проаналізувати результати, включаючи значення R-квадрат і бета-коефіцієнти, щоб визначити точне співвідношення між годинами навчання та оцінкою студента. ‘Підсумковий іспит.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як виконати просту лінійну регресію в SAS
Як виконати множинну лінійну регресію в SAS
Як розрахувати R-квадрат у SAS
Як розрахувати RMSE в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *