Як створити фіктивні змінні в sas (з прикладом)


Фіктивна змінна — це тип змінної, яку ми створюємо в регресійному аналізі, щоб ми могли представити категоріальну змінну як числову змінну, яка приймає одне з двох значень: нуль або одиницю.

Наприклад, припустімо, що ми маємо такий набір даних і хочемо використовувати вік і сімейний стан для прогнозування доходу :

Щоб використовувати сімейний стан як змінну прогнозу в регресійній моделі, нам потрібно перетворити його на фіктивну змінну.

Оскільки наразі це категоріальна змінна, яка може приймати три різні значення («Одружений», «Одружений» або «Розлучений»), нам потрібно створити k -1 = 3-1 = 2 фіктивні змінні.

Щоб створити цю фіктивну змінну, ми можемо залишити «Single» як базове значення, оскільки воно з’являється найчастіше. Отже, ось як ми перетворимо сімейний стан у фіктивні змінні:

У наступному прикладі показано, як створити фіктивні змінні для цього точного набору даних у SAS.

Приклад: створення фіктивних змінних у SAS

Спочатку давайте створимо такий набір даних у SAS:

 /*create dataset*/
data original_data;
    input income age status $;
    datalines ;
45 23 single
48 25 single
54 24 single
57 29 single
65 38 married
69 36 single
78 40 married
83 59 divorced
98 56 divorced
104 64 married
107 53 married
;
run ;

/*view dataset*/
proc print data = original_data; 

Далі ми можемо використати два оператори IF-THEN-ELSE для створення фіктивних змінних для змінної стану :

 /*create new dataset with dummy variables*/
data new_data;
	set original_data;
	if status = " married " then married = 1 ;
	  else married = 0 ;
	if status = " divorced " then divorced = 1 ;
	  else divorced = 0 ;
run ;

/*view new dataset*/
proc print data =new_data;

фіктивні змінні в прикладі SAS

Зверніть увагу, що значення двох фіктивних змінних ( одружений і розлучений ) збігаються зі значеннями, які ми обчислили у вступному прикладі.

Тоді ми могли б використати ці фіктивні змінні в регресійній моделі , якщо забажаємо, оскільки вони обидві числові.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як використовувати зведення процедур у SAS
Як використовувати Proc Tabulate у SAS
Як перейменувати змінні в SAS
Як створити нові змінні в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *