Jak utworzyć zmienne fikcyjne w sas-ie (z przykładem)


Zmienna fikcyjna to typ zmiennej, który tworzymy w analizie regresji, abyśmy mogli przedstawić zmienną kategorialną jako zmienną numeryczną, która przyjmuje jedną z dwóch wartości: zero lub jeden.

Załóżmy na przykład, że mamy następujący zestaw danych i chcemy wykorzystać wiek i stan cywilny do przewidywania dochodów :

Aby wykorzystać stan cywilny jako zmienną predykcyjną w modelu regresji, musimy przekształcić go w zmienną fikcyjną.

Ponieważ jest to obecnie zmienna kategoryczna, która może przyjmować trzy różne wartości („Singiel”, „Żonaty” lub „Rozwiedziony”), musimy utworzyć k -1 = 3-1 = 2 zmienne fikcyjne.

Aby utworzyć tę fikcyjną zmienną, możemy pozostawić „Single” jako wartość bazową, ponieważ pojawia się ona najczęściej. Oto jak przekształcilibyśmy stan cywilny w zmienne fikcyjne:

Poniższy przykład pokazuje, jak utworzyć zmienne fikcyjne dla dokładnie tego zbioru danych w SAS-ie.

Przykład: tworzenie zmiennych fikcyjnych w SAS-ie

Najpierw utwórzmy następujący zbiór danych w SAS-ie:

 /*create dataset*/
data original_data;
    input income age status $;
    datalines ;
45 23 single
48 25 single
54 24 single
57 29 single
65 38 married
69 36 single
78 40 married
83 59 divorced
98 56 divorced
104 64 married
107 53 married
;
run ;

/*view dataset*/
proc print data = original_data; 

Następnie możemy użyć dwóch instrukcji IF-THEN-ELSE, aby utworzyć zmienne fikcyjne dla zmiennej stanu :

 /*create new dataset with dummy variables*/
data new_data;
	set original_data;
	if status = " married " then married = 1 ;
	  else married = 0 ;
	if status = " divorced " then divorced = 1 ;
	  else divorced = 0 ;
run ;

/*view new dataset*/
proc print data =new_data;

zmienne fikcyjne w przykładzie SAS-owym

Zwróć uwagę, że wartości dwóch zmiennych fikcyjnych ( żonaty i rozwiedziony ) odpowiadają wartościom, które obliczyliśmy we wstępnym przykładzie.

Gdybyśmy chcieli, moglibyśmy następnie użyć tych zmiennych fikcyjnych w modelu regresji , ponieważ obie są liczbowe.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak korzystać ze podsumowania procedur w SAS-ie
Jak używać Proc Tabulate w SAS-ie
Jak zmienić nazwy zmiennych w SAS-ie
Jak utworzyć nowe zmienne w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *