Dummyvariabelen maken in sas (met voorbeeld)
Een dummyvariabele is een type variabele die we creëren in regressieanalyse, zodat we een categorische variabele kunnen weergeven als een numerieke variabele die een van de twee waarden kan aannemen: nul of één.
Stel dat we de volgende gegevensset hebben en leeftijd en burgerlijke staat willen gebruiken om het inkomen te voorspellen:
Om de burgerlijke staat als voorspellende variabele in een regressiemodel te gebruiken, moeten we deze omzetten in een dummyvariabele.
Omdat dit momenteel een categorische variabele is die drie verschillende waarden kan aannemen („Single“, „Married“ of „Divorced“), moeten we k -1 = 3-1 = 2 dummyvariabelen maken.
Om deze dummyvariabele te maken, kunnen we ‚Single‘ als basiswaarde laten staan, aangezien deze het vaakst voorkomt. Dus hier is hoe we de burgerlijke staat zouden omzetten in dummyvariabelen:
In het volgende voorbeeld ziet u hoe u dummyvariabelen maakt voor deze exacte gegevensset in SAS.
Voorbeeld: dummyvariabelen maken in SAS
Laten we eerst de volgende gegevensset in SAS maken:
/*create dataset*/ data original_data; input income age status $; datalines ; 45 23 single 48 25 single 54 24 single 57 29 single 65 38 married 69 36 single 78 40 married 83 59 divorced 98 56 divorced 104 64 married 107 53 married ; run ; /*view dataset*/ proc print data = original_data;
Vervolgens kunnen we twee IF-THEN-ELSE-instructies gebruiken om dummyvariabelen voor de statusvariabele te maken:
/*create new dataset with dummy variables*/
data new_data;
set original_data;
if status = " married " then married = 1 ;
else married = 0 ;
if status = " divorced " then divorced = 1 ;
else divorced = 0 ;
run ;
/*view new dataset*/
proc print data =new_data;
Merk op dat de waarden van de twee dummyvariabelen ( getrouwd en gescheiden ) overeenkomen met de waarden die we in het inleidende voorbeeld hebben berekend.
We zouden deze dummyvariabelen vervolgens in een regressiemodel kunnen gebruiken als we dat zouden willen, omdat ze allebei numeriek zijn.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:
Procedureoverzicht gebruiken in SAS
Proc-tabel gebruiken in SAS
Variabelen hernoemen in SAS
Nieuwe variabelen maken in SAS