Dummyvariabelen maken in sas (met voorbeeld)


Een dummyvariabele is een type variabele die we creëren in regressieanalyse, zodat we een categorische variabele kunnen weergeven als een numerieke variabele die een van de twee waarden kan aannemen: nul of één.

Stel dat we de volgende gegevensset hebben en leeftijd en burgerlijke staat willen gebruiken om het inkomen te voorspellen:

Om de burgerlijke staat als voorspellende variabele in een regressiemodel te gebruiken, moeten we deze omzetten in een dummyvariabele.

Omdat dit momenteel een categorische variabele is die drie verschillende waarden kan aannemen („Single“, „Married“ of „Divorced“), moeten we k -1 = 3-1 = 2 dummyvariabelen maken.

Om deze dummyvariabele te maken, kunnen we ‚Single‘ als basiswaarde laten staan, aangezien deze het vaakst voorkomt. Dus hier is hoe we de burgerlijke staat zouden omzetten in dummyvariabelen:

In het volgende voorbeeld ziet u hoe u dummyvariabelen maakt voor deze exacte gegevensset in SAS.

Voorbeeld: dummyvariabelen maken in SAS

Laten we eerst de volgende gegevensset in SAS maken:

 /*create dataset*/
data original_data;
    input income age status $;
    datalines ;
45 23 single
48 25 single
54 24 single
57 29 single
65 38 married
69 36 single
78 40 married
83 59 divorced
98 56 divorced
104 64 married
107 53 married
;
run ;

/*view dataset*/
proc print data = original_data; 

Vervolgens kunnen we twee IF-THEN-ELSE-instructies gebruiken om dummyvariabelen voor de statusvariabele te maken:

 /*create new dataset with dummy variables*/
data new_data;
	set original_data;
	if status = " married " then married = 1 ;
	  else married = 0 ;
	if status = " divorced " then divorced = 1 ;
	  else divorced = 0 ;
run ;

/*view new dataset*/
proc print data =new_data;

dummyvariabelen in het SAS-voorbeeld

Merk op dat de waarden van de twee dummyvariabelen ( getrouwd en gescheiden ) overeenkomen met de waarden die we in het inleidende voorbeeld hebben berekend.

We zouden deze dummyvariabelen vervolgens in een regressiemodel kunnen gebruiken als we dat zouden willen, omdat ze allebei numeriek zijn.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Procedureoverzicht gebruiken in SAS
Proc-tabel gebruiken in SAS
Variabelen hernoemen in SAS
Nieuwe variabelen maken in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert