So erstellen sie dummy-variablen in sas (mit beispiel)


Eine Dummy-Variable ist ein Variablentyp, den wir in der Regressionsanalyse erstellen, damit wir eine kategoriale Variable als numerische Variable darstellen können, die einen von zwei Werten annimmt: Null oder Eins.

Angenommen, wir haben den folgenden Datensatz und möchten Alter und Familienstand verwenden, um das Einkommen vorherzusagen:

Um den Familienstand als Prädiktorvariable in einem Regressionsmodell zu verwenden, müssen wir ihn in eine Dummy-Variable umwandeln.

Da es sich derzeit um eine kategoriale Variable handelt, die drei verschiedene Werte annehmen kann („Single“, „Verheiratet“ oder „Geschieden“), müssen wir k -1 = 3-1 = 2 Dummy-Variablen erstellen.

Um diese Dummy-Variable zu erstellen, können wir „Single“ als Basiswert belassen, da diese am häufigsten vorkommt. So würden wir den Familienstand in Dummy-Variablen umwandeln:

Das folgende Beispiel zeigt, wie Sie Dummy-Variablen für genau diesen Datensatz in SAS erstellen.

Beispiel: Dummy-Variablen in SAS erstellen

Erstellen wir zunächst den folgenden Datensatz in SAS:

 /*create dataset*/
data original_data;
    input income age status $;
    datalines ;
45 23 single
48 25 single
54 24 single
57 29 single
65 38 married
69 36 single
78 40 married
83 59 divorced
98 56 divorced
104 64 married
107 53 married
;
run ;

/*view dataset*/
proc print data = original_data; 

Als nächstes können wir zwei IF-THEN-ELSE-Anweisungen verwenden, um Dummy-Variablen für die Zustandsvariable zu erstellen:

 /*create new dataset with dummy variables*/
data new_data;
	set original_data;
	if status = " married " then married = 1 ;
	  else married = 0 ;
	if status = " divorced " then divorced = 1 ;
	  else divorced = 0 ;
run ;

/*view new dataset*/
proc print data =new_data;

Dummy-Variablen im SAS-Beispiel

Beachten Sie, dass die Werte der beiden Dummy-Variablen ( verheiratet und geschieden ) mit den Werten übereinstimmen, die wir im Einführungsbeispiel berechnet haben.

Wenn wir wollten, könnten wir diese Dummy-Variablen dann in einem Regressionsmodell verwenden, da sie beide numerisch sind.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:

So verwenden Sie die Verfahrenszusammenfassung in SAS
So verwenden Sie Proc Tabulate in SAS
So benennen Sie Variablen in SAS um
So erstellen Sie neue Variablen in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert