Como usar proc stdize em sas (com exemplo)


Padronizar uma variável significa dimensionar cada um dos valores da variável de forma que o valor médio seja 0 e o desvio padrão seja 1.

Você pode usar a seguinte fórmula para padronizar uma variável

(x eux ) / s

Ouro:

  • x i : o i- ésimo valor do conjunto de dados
  • x : A amostra significa
  • s : o desvio padrão da amostra

A maneira mais fácil de padronizar uma variável no SAS é usar a instrução PROC STDIZE .

O exemplo a seguir mostra como usar essa afirmação na prática.

Exemplo: como usar PROC STDIZE em SAS

Suponha que temos o seguinte conjunto de dados no SAS que contém informações sobre vários jogadores de basquete:

 /*create first dataset*/ 
data my_data;
    input player $ points assists rebounds;
    datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;

/*view dataset*/
proc print data =my_data;

Podemos usar a instrução PROC STDIZE para criar um novo conjunto de dados que padronize cada uma das variáveis numéricas no conjunto de dados:

 /*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;

/*view new dataset*/
proc print data =std_data; 

Cada uma das variáveis numéricas (pontos, assistências, rebotes) foi padronizada para ter média 0 e desvio padrão 1.

Observe que também podemos usar a instrução VAR para especificar quais variáveis normalizar.

Por exemplo, podemos usar a seguinte instrução PROC STDIZE com a instrução VAR para normalizar apenas a variável points:

 /*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
    var points;
run ;

/*view new dataset*/
proc print data =std_data; 

Os valores da coluna de pontos foram padronizados enquanto todas as outras colunas permaneceram intactas.

Podemos usar a instrução PROC MEANS para verificar se a variável points agora tem um valor médio de 0 e um desvio padrão de 1:

 /*view mean and standard deviation of each variable*/
proc means data =std_data; 

Vemos que a variável pontos tem valor médio 0 e desvio padrão 1.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como excluir linhas com valores ausentes no SAS
Como calcular o desvio padrão no SAS (3 exemplos)
Como calcular pontuações Z no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *