Jak utworzyć zmienne fikcyjne w sas-ie (z przykładem)
Zmienna fikcyjna to typ zmiennej, który tworzymy w analizie regresji, abyśmy mogli przedstawić zmienną kategorialną jako zmienną numeryczną, która przyjmuje jedną z dwóch wartości: zero lub jeden.
Załóżmy na przykład, że mamy następujący zestaw danych i chcemy wykorzystać wiek i stan cywilny do przewidywania dochodów :
Aby wykorzystać stan cywilny jako zmienną predykcyjną w modelu regresji, musimy przekształcić go w zmienną fikcyjną.
Ponieważ jest to obecnie zmienna kategoryczna, która może przyjmować trzy różne wartości („Singiel”, „Żonaty” lub „Rozwiedziony”), musimy utworzyć k -1 = 3-1 = 2 zmienne fikcyjne.
Aby utworzyć tę fikcyjną zmienną, możemy pozostawić „Single” jako wartość bazową, ponieważ pojawia się ona najczęściej. Oto jak przekształcilibyśmy stan cywilny w zmienne fikcyjne:
Poniższy przykład pokazuje, jak utworzyć zmienne fikcyjne dla dokładnie tego zbioru danych w SAS-ie.
Przykład: tworzenie zmiennych fikcyjnych w SAS-ie
Najpierw utwórzmy następujący zbiór danych w SAS-ie:
/*create dataset*/ data original_data; input income age status $; datalines ; 45 23 single 48 25 single 54 24 single 57 29 single 65 38 married 69 36 single 78 40 married 83 59 divorced 98 56 divorced 104 64 married 107 53 married ; run ; /*view dataset*/ proc print data = original_data;
Następnie możemy użyć dwóch instrukcji IF-THEN-ELSE, aby utworzyć zmienne fikcyjne dla zmiennej stanu :
/*create new dataset with dummy variables*/
data new_data;
set original_data;
if status = " married " then married = 1 ;
else married = 0 ;
if status = " divorced " then divorced = 1 ;
else divorced = 0 ;
run ;
/*view new dataset*/
proc print data =new_data;
Zwróć uwagę, że wartości dwóch zmiennych fikcyjnych ( żonaty i rozwiedziony ) odpowiadają wartościom, które obliczyliśmy we wstępnym przykładzie.
Gdybyśmy chcieli, moglibyśmy następnie użyć tych zmiennych fikcyjnych w modelu regresji , ponieważ obie są liczbowe.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak korzystać ze podsumowania procedur w SAS-ie
Jak używać Proc Tabulate w SAS-ie
Jak zmienić nazwy zmiennych w SAS-ie
Jak utworzyć nowe zmienne w SAS-ie