So erstellen sie dummy-variablen in sas (mit beispiel)
Eine Dummy-Variable ist ein Variablentyp, den wir in der Regressionsanalyse erstellen, damit wir eine kategoriale Variable als numerische Variable darstellen können, die einen von zwei Werten annimmt: Null oder Eins.
Angenommen, wir haben den folgenden Datensatz und möchten Alter und Familienstand verwenden, um das Einkommen vorherzusagen:
Um den Familienstand als Prädiktorvariable in einem Regressionsmodell zu verwenden, müssen wir ihn in eine Dummy-Variable umwandeln.
Da es sich derzeit um eine kategoriale Variable handelt, die drei verschiedene Werte annehmen kann („Single“, „Verheiratet“ oder „Geschieden“), müssen wir k -1 = 3-1 = 2 Dummy-Variablen erstellen.
Um diese Dummy-Variable zu erstellen, können wir „Single“ als Basiswert belassen, da diese am häufigsten vorkommt. So würden wir den Familienstand in Dummy-Variablen umwandeln:
Das folgende Beispiel zeigt, wie Sie Dummy-Variablen für genau diesen Datensatz in SAS erstellen.
Beispiel: Dummy-Variablen in SAS erstellen
Erstellen wir zunächst den folgenden Datensatz in SAS:
/*create dataset*/ data original_data; input income age status $; datalines ; 45 23 single 48 25 single 54 24 single 57 29 single 65 38 married 69 36 single 78 40 married 83 59 divorced 98 56 divorced 104 64 married 107 53 married ; run ; /*view dataset*/ proc print data = original_data;
Als nächstes können wir zwei IF-THEN-ELSE-Anweisungen verwenden, um Dummy-Variablen für die Zustandsvariable zu erstellen:
/*create new dataset with dummy variables*/
data new_data;
set original_data;
if status = " married " then married = 1 ;
else married = 0 ;
if status = " divorced " then divorced = 1 ;
else divorced = 0 ;
run ;
/*view new dataset*/
proc print data =new_data;
Beachten Sie, dass die Werte der beiden Dummy-Variablen ( verheiratet und geschieden ) mit den Werten übereinstimmen, die wir im Einführungsbeispiel berechnet haben.
Wenn wir wollten, könnten wir diese Dummy-Variablen dann in einem Regressionsmodell verwenden, da sie beide numerisch sind.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:
So verwenden Sie die Verfahrenszusammenfassung in SAS
So verwenden Sie Proc Tabulate in SAS
So benennen Sie Variablen in SAS um
So erstellen Sie neue Variablen in SAS