Як розрахувати r-квадрат у sas


R-квадрат , який часто записують як r2 , є показником того, наскільки модель лінійної регресії відповідає набору даних.

Це значення представляє частку дисперсії у змінній відповіді , яку можна пояснити змінною предиктора.

Значення r 2 може коливатися від 0 до 1:

  • Значення 0 вказує на те, що змінна відповіді взагалі не може бути пояснена змінною предиктора.
  • Значення 1 вказує на те, що змінна відповіді може бути ідеально пояснена безпомилково змінною предиктора.

За темою: що таке хороше значення R-квадрат?

У наступному покроковому прикладі показано, як обчислити значення R-квадрат для простої моделі лінійної регресії в SAS.

Крок 1: Створіть дані

Для цього прикладу ми створимо набір даних, що містить загальну кількість вивчених годин і оцінку підсумкового іспиту 15 студентів.

Ми підберемо просту модель лінійної регресії, використовуючи години як змінну прогностику та оцінку як змінну відповіді.

Наступний код показує, як створити цей набір даних у SAS:

 /*create dataset*/
data exam_data;
    input hours score;
    datalines ;
1 64
2 66
4 76
5 73
5 74
6 81
6 83
7 82
8 80
10 88
11 84
11 82
12 91
12 93
14 89
;
run ;

/*view dataset*/
proc print data =exam_data;

Крок 2. Підберіть просту модель лінійної регресії

Далі ми використаємо proc reg , щоб відповідати моделі простої лінійної регресії:

 /*fit simple linear regression model*/
proc reg data =exam_data;
    model score = hours;
run ; 

вихід простої лінійної регресії в SAS

Зверніть увагу, що значення R-квадрат у вихідних даних становить 0,8310.

Це означає, що 83,1% варіації оцінок на іспитах можна пояснити кількістю вивчених годин.

Крок 3. Витягніть значення R-квадрат із регресійної моделі

Якщо ви хочете відобразити лише значення R-квадрат цієї моделі та не отримати жодних інших вихідних результатів, ви можете використати такий код:

 /*fit simple linear regression model*/
proc reg data =exam_data outest =outest noprint ;
    model score = hours / rsquare ;
run ;
quit ;

/*print R-squared value of model*/
proc print data =outest;
    var _RSQ_;
run ; 

Зверніть увагу, що у вихідних даних відображається лише значення R-квадрат 0,83098 .

Примітка . Аргумент noprint у proc reg повідомляє SAS не друкувати весь вихід результатів регресії, як це було на попередньому кроці.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як виконати просту лінійну регресію в SAS
Як виконати множинну лінійну регресію в SAS
Як виконати поліноміальну регресію в SAS
Як виконати логістичну регресію в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *