Como criar variáveis fictícias em sas (com exemplo)


Uma variável fictícia é um tipo de variável que criamos na análise de regressão para que possamos representar uma variável categórica como uma variável numérica que assume um de dois valores: zero ou um.

Por exemplo, suponha que temos o seguinte conjunto de dados e queremos usar a idade e o estado civil para prever a renda :

Para usar o estado civil como variável preditora em um modelo de regressão, precisamos convertê-lo em uma variável dummy.

Como esta é atualmente uma variável categórica que pode assumir três valores diferentes (“Solteiro”, “Casado” ou “Divorciado”), precisamos criar k -1 = 3-1 = 2 variáveis fictícias.

Para criar esta variável fictícia, podemos deixar “Single” como valor base, pois ele aparece com mais frequência. Então, aqui está como converteríamos o estado civil em variáveis fictícias:

O exemplo a seguir mostra como criar variáveis fictícias para este conjunto de dados exato no SAS.

Exemplo: Criando Variáveis Dummy em SAS

Primeiro, vamos criar o seguinte conjunto de dados no SAS:

 /*create dataset*/
data original_data;
    input income age status $;
    datalines ;
45 23 single
48 25 single
54 24 single
57 29 single
65 38 married
69 36 single
78 40 married
83 59 divorced
98 56 divorced
104 64 married
107 53 married
;
run ;

/*view dataset*/
proc print data = original_data; 

A seguir, podemos usar duas instruções IF-THEN-ELSE para criar variáveis fictícias para a variável de estado :

 /*create new dataset with dummy variables*/
data new_data;
	set original_data;
	if status = " married " then married = 1 ;
	  else married = 0 ;
	if status = " divorced " then divorced = 1 ;
	  else divorced = 0 ;
run ;

/*view new dataset*/
proc print data =new_data;

variáveis fictícias no exemplo SAS

Observe que os valores das duas variáveis dummies ( casado e divorciado ) correspondem aos valores que calculamos no exemplo introdutório.

Poderíamos então usar essas variáveis fictícias em um modelo de regressão , se quiséssemos, já que ambas são numéricas.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como usar o resumo do procedimento no SAS
Como usar o Proc Tabulate no SAS
Como renomear variáveis no SAS
Como criar novas variáveis no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *