Come utilizzare proc stdize in sas (con esempio)


Standardizzare una variabile significa ridimensionare ciascuno dei valori della variabile in modo tale che il valore medio sia 0 e la deviazione standard sia 1.

È possibile utilizzare la formula seguente per standardizzare una variabile

(x ix ) / s

Oro:

  • x i : l’i -esimo valore del set di dati
  • x : Il campione significa
  • s : la deviazione standard del campione

Il modo più semplice per standardizzare una variabile in SAS è utilizzare l’istruzione PROC STDIZE .

L’esempio seguente mostra come utilizzare questa affermazione nella pratica.

Esempio: come utilizzare PROC STDIZE in SAS

Supponiamo di avere il seguente set di dati in SAS che contiene informazioni su vari giocatori di basket:

 /*create first dataset*/ 
data my_data;
    input player $ points assists rebounds;
    datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;

/*view dataset*/
proc print data =my_data;

Possiamo utilizzare l’istruzione PROC STDIZE per creare un nuovo set di dati che standardizza ciascuna delle variabili numeriche nel set di dati:

 /*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;

/*view new dataset*/
proc print data =std_data; 

Ciascuna delle variabili numeriche (punti, assist, rimbalzi) è stata standardizzata per avere una media pari a 0 e una deviazione standard pari a 1.

Nota che possiamo anche usare l’istruzione VAR per specificare quali variabili normalizzare.

Ad esempio, possiamo utilizzare la seguente istruzione PROC STDIZE con l’istruzione VAR per normalizzare solo la variabile punti:

 /*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
    var points;
run ;

/*view new dataset*/
proc print data =std_data; 

I valori nella colonna dei punti sono stati standardizzati mentre tutte le altre colonne sono rimaste intatte.

Possiamo utilizzare l’istruzione PROC MEANS per verificare che la variabile points ora abbia un valore medio pari a 0 e una deviazione standard pari a 1:

 /*view mean and standard deviation of each variable*/
proc means data =std_data; 

Vediamo che la variabile punti ha un valore medio pari a 0 e una deviazione standard pari a 1.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come eliminare righe con valori mancanti in SAS
Come calcolare la deviazione standard in SAS (3 esempi)
Come calcolare i punteggi Z in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *