Як розрахувати rmse в sas
Один із способів оцінити, наскільки регресійна модель відповідає набору даних, — обчислити середню квадратичну помилку , яка є показником, який повідомляє нам про середню відстань між прогнозованими значеннями моделі та фактичними значеннями набору даних.
Чим нижче RMSE, тим краще дана модель здатна «відповідати» набору даних.
Формула для знаходження середньої квадратичної помилки, часто скорочена RMSE , така:
RMSE = √ Σ(P i – O i ) 2 / n
золото:
- Σ – символ, що позначає «суму»
- P i – прогнозоване значення для i-го спостереження в наборі даних
- O i — спостережене значення для i-го спостереження в наборі даних
- n – розмір вибірки
Наступний покроковий приклад показує, як обчислити RMSE для простої моделі лінійної регресії в SAS.
Крок 1: Створіть дані
Для цього прикладу ми створимо набір даних, що містить загальну кількість вивчених годин і оцінку підсумкового іспиту 15 студентів.
Ми підберемо просту модель лінійної регресії, використовуючи години як змінну прогностику та оцінку як змінну відповіді.
Наступний код показує, як створити цей набір даних у SAS:
/*create dataset*/ data exam_data; input hours score; datalines ; 1 64 2 66 4 76 5 73 5 74 6 81 6 83 7 82 8 80 10 88 11 84 11 82 12 91 12 93 14 89 ; run ; /*view dataset*/ proc print data =exam_data;
Крок 2. Підберіть просту модель лінійної регресії
Далі ми використаємо proc reg , щоб відповідати моделі простої лінійної регресії:
/*fit simple linear regression model*/ proc reg data =exam_data; model score = hours; run ;
Зауважте, що RMSE у вихідних даних становить 3,64093 .
Крок 3: Витягніть RMSE з регресійної моделі
Якщо ви хочете відобразити лише RMSE цієї моделі та не отримати жодних інших вихідних результатів, ви можете використати такий код:
/*fit simple linear regression model*/ proc reg data =exam_data outest =outest noprint ; model score = hours / rmse ; run ; quit ; /*print RMSE of model*/ proc print data =outest; var _RMSE_; run ;
Зауважте, що у вихідних даних відображається лише значення RMSE 3,64093 .
Примітка . Аргумент noprint у proc reg повідомляє SAS не друкувати весь вихід результатів регресії, як це було на попередньому кроці.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як виконати просту лінійну регресію в SAS
Як виконати множинну лінійну регресію в SAS
Як виконати поліноміальну регресію в SAS
Як виконати логістичну регресію в SAS