Як розрахувати r-квадрат у sas
R-квадрат , який часто записують як r2 , є показником того, наскільки модель лінійної регресії відповідає набору даних.
Це значення представляє частку дисперсії у змінній відповіді , яку можна пояснити змінною предиктора.
Значення r 2 може коливатися від 0 до 1:
- Значення 0 вказує на те, що змінна відповіді взагалі не може бути пояснена змінною предиктора.
- Значення 1 вказує на те, що змінна відповіді може бути ідеально пояснена безпомилково змінною предиктора.
За темою: що таке хороше значення R-квадрат?
У наступному покроковому прикладі показано, як обчислити значення R-квадрат для простої моделі лінійної регресії в SAS.
Крок 1: Створіть дані
Для цього прикладу ми створимо набір даних, що містить загальну кількість вивчених годин і оцінку підсумкового іспиту 15 студентів.
Ми підберемо просту модель лінійної регресії, використовуючи години як змінну прогностику та оцінку як змінну відповіді.
Наступний код показує, як створити цей набір даних у SAS:
/*create dataset*/ data exam_data; input hours score; datalines ; 1 64 2 66 4 76 5 73 5 74 6 81 6 83 7 82 8 80 10 88 11 84 11 82 12 91 12 93 14 89 ; run ; /*view dataset*/ proc print data =exam_data;
Крок 2. Підберіть просту модель лінійної регресії
Далі ми використаємо proc reg , щоб відповідати моделі простої лінійної регресії:
/*fit simple linear regression model*/ proc reg data =exam_data; model score = hours; run ;
Зверніть увагу, що значення R-квадрат у вихідних даних становить 0,8310.
Це означає, що 83,1% варіації оцінок на іспитах можна пояснити кількістю вивчених годин.
Крок 3. Витягніть значення R-квадрат із регресійної моделі
Якщо ви хочете відобразити лише значення R-квадрат цієї моделі та не отримати жодних інших вихідних результатів, ви можете використати такий код:
/*fit simple linear regression model*/ proc reg data =exam_data outest =outest noprint ; model score = hours / rsquare ; run ; quit ; /*print R-squared value of model*/ proc print data =outest; var _RSQ_; run ;
Зверніть увагу, що у вихідних даних відображається лише значення R-квадрат 0,83098 .
Примітка . Аргумент noprint у proc reg повідомляє SAS не друкувати весь вихід результатів регресії, як це було на попередньому кроці.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як виконати просту лінійну регресію в SAS
Як виконати множинну лінійну регресію в SAS
Як виконати поліноміальну регресію в SAS
Як виконати логістичну регресію в SAS