Як створити фіктивні змінні в sas (з прикладом)
Фіктивна змінна — це тип змінної, яку ми створюємо в регресійному аналізі, щоб ми могли представити категоріальну змінну як числову змінну, яка приймає одне з двох значень: нуль або одиницю.
Наприклад, припустімо, що ми маємо такий набір даних і хочемо використовувати вік і сімейний стан для прогнозування доходу :
Щоб використовувати сімейний стан як змінну прогнозу в регресійній моделі, нам потрібно перетворити його на фіктивну змінну.
Оскільки наразі це категоріальна змінна, яка може приймати три різні значення («Одружений», «Одружений» або «Розлучений»), нам потрібно створити k -1 = 3-1 = 2 фіктивні змінні.
Щоб створити цю фіктивну змінну, ми можемо залишити «Single» як базове значення, оскільки воно з’являється найчастіше. Отже, ось як ми перетворимо сімейний стан у фіктивні змінні:
У наступному прикладі показано, як створити фіктивні змінні для цього точного набору даних у SAS.
Приклад: створення фіктивних змінних у SAS
Спочатку давайте створимо такий набір даних у SAS:
/*create dataset*/ data original_data; input income age status $; datalines ; 45 23 single 48 25 single 54 24 single 57 29 single 65 38 married 69 36 single 78 40 married 83 59 divorced 98 56 divorced 104 64 married 107 53 married ; run ; /*view dataset*/ proc print data = original_data;
Далі ми можемо використати два оператори IF-THEN-ELSE для створення фіктивних змінних для змінної стану :
/*create new dataset with dummy variables*/
data new_data;
set original_data;
if status = " married " then married = 1 ;
else married = 0 ;
if status = " divorced " then divorced = 1 ;
else divorced = 0 ;
run ;
/*view new dataset*/
proc print data =new_data;
Зверніть увагу, що значення двох фіктивних змінних ( одружений і розлучений ) збігаються зі значеннями, які ми обчислили у вступному прикладі.
Тоді ми могли б використати ці фіктивні змінні в регресійній моделі , якщо забажаємо, оскільки вони обидві числові.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як використовувати зведення процедур у SAS
Як використовувати Proc Tabulate у SAS
Як перейменувати змінні в SAS
Як створити нові змінні в SAS