Come creare variabili fittizie in sas (con esempio)


Una variabile fittizia è un tipo di variabile che creiamo nell’analisi di regressione in modo da poter rappresentare una variabile categoriale come variabile numerica che assume uno dei due valori: zero o uno.

Ad esempio, supponiamo di avere il seguente set di dati e di voler utilizzare l’età e lo stato civile per prevedere il reddito :

Per utilizzare lo stato civile come variabile predittiva in un modello di regressione, dobbiamo convertirlo in una variabile fittizia.

Poiché attualmente si tratta di una variabile categoriale che può assumere tre valori diversi (“Single”, “Sposato” o “Divorziato”), dobbiamo creare k -1 = 3-1 = 2 variabili dummy.

Per creare questa variabile fittizia, possiamo lasciare “Single” come valore base poiché appare più spesso. Quindi, ecco come convertiremo lo stato civile in variabili fittizie:

L’esempio seguente mostra come creare variabili fittizie per questo set di dati esatto in SAS.

Esempio: creazione di variabili fittizie in SAS

Innanzitutto, creiamo il seguente set di dati in SAS:

 /*create dataset*/
data original_data;
    input income age status $;
    datalines ;
45 23 single
48 25 single
54 24 single
57 29 single
65 38 married
69 36 single
78 40 married
83 59 divorced
98 56 divorced
104 64 married
107 53 married
;
run ;

/*view dataset*/
proc print data = original_data; 

Successivamente, possiamo utilizzare due istruzioni IF-THEN-ELSE per creare variabili fittizie per la variabile di stato :

 /*create new dataset with dummy variables*/
data new_data;
	set original_data;
	if status = " married " then married = 1 ;
	  else married = 0 ;
	if status = " divorced " then divorced = 1 ;
	  else divorced = 0 ;
run ;

/*view new dataset*/
proc print data =new_data;

variabili fittizie nell'esempio SAS

Si noti che i valori delle due variabili dummy ( sposato e divorziato ) corrispondono ai valori che abbiamo calcolato nell’esempio introduttivo.

Se volessimo, potremmo quindi utilizzare queste variabili fittizie in un modello di regressione , poiché sono entrambe numeriche.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come utilizzare il riepilogo della procedura in SAS
Come utilizzare Proc Tabulate in SAS
Come rinominare le variabili in SAS
Come creare nuove variabili in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *