Як розрахувати aic у sas (з прикладом)
Інформаційний критерій Akaike (AIC) — це метрика, яка використовується для порівняння відповідності множинних регресійних моделей.
Він розраховується таким чином:
AIC = 2K – 2 ln (L)
золото:
- K: Кількість параметрів моделі. Значення K за замовчуванням дорівнює 2, тому модель лише з однією змінною предиктора матиме значення K 2+1 = 3.
- ln (L) : логарифм правдоподібності моделі. Більшість статистичних програм можуть автоматично обчислити це значення для вас.
AIC розроблено, щоб знайти модель, яка пояснює найбільшу варіацію в даних, водночас штрафуючи моделі, які використовують надмірну кількість параметрів.
Після встановлення кількох регресійних моделей ви можете порівняти значення AIC кожної моделі. Чим нижче AIC, тим більше підходить модель.
У наступному прикладі показано, як обчислити AIC для різних моделей регресії в SAS.
Приклад: як розрахувати AIC у SAS
Припустімо, ми хочемо підібрати три різні моделі множинної лінійної регресії , щоб передбачити оцінку, яку студенти отримають на іспиті в класі.
Ось змінні предиктора, які ми будемо використовувати в кожній моделі:
- Змінні предиктора в моделі 1: години, витрачені на навчання
- Змінні предикторів у моделі 2: минулі практичні іспити
- Прогностичні змінні в моделі 3: години, витрачені на навчання, і практичні іспити
Спочатку ми використаємо наступний код, щоб створити набір даних, що містить цю інформацію для 20 студентів:
/*create dataset*/ data exam_data; input hours prep_exams score; datalines ; 1 1 76 2 3 78 2 3 85 4 5 88 2 2 72 1 2 69 5 1 94 4 1 94 2 0 88 4 3 92 4 4 90 3 3 75 6 2 96 5 4 90 3 4 82 4 4 85 6 5 99 2 1 83 1 0 62 2 1 76 ; run ;
Далі ми використаємо proc reg , щоб відповідати кожній із цих регресійних моделей, і використаємо оператор selection=adjrsq sse aic, щоб обчислити значення AIC для кожної моделі:
/*fit multiple linear regression models and calculate AIC for each model*/ proc reg data =exam_data; model score = hours prep_exams / selection=adjrsq sse aic; run ;
З результату ми можемо побачити значення AIC для кожної моделі:
- AIC з годинами як змінною предиктора: 68,4537
- AIC з годинами та іспитами як предикторними змінними: 69,9507
- AIC з іспитами як прогностичною змінною: 91,4967
Модель з найнижчим значенням AIC – це та, яка містить лише години як змінну-прогноз.
Таким чином, ми заявляємо, що наступна модель найкраще відповідає даним:
Оцінка = β 0 + β 1 (вивчені години)
Коли ми визначимо цю модель як найкращу, ми зможемо підібрати її та проаналізувати результати, включаючи значення R-квадрат і бета-коефіцієнти, щоб визначити точне співвідношення між годинами навчання та оцінкою студента. ‘Підсумковий іспит.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як виконати просту лінійну регресію в SAS
Як виконати множинну лінійну регресію в SAS
Як розрахувати R-квадрат у SAS
Як розрахувати RMSE в SAS