Come normalizzare i dati in sas
“Normalizzare” un insieme di valori di dati significa ridimensionare i valori in modo tale che la media di tutti i valori sia 0 e la deviazione standard sia 1.
Questo tutorial spiega come normalizzare i dati in SAS.
Esempio: come normalizzare i dati in SAS
Supponiamo di avere il seguente set di dati:
Completa i seguenti passaggi per normalizzare questo set di valori di dati in SAS.
Passaggio 1: crea il set di dati
Innanzitutto, utilizziamo il seguente codice per creare il set di dati in SAS:
/*create dataset*/ data original_data; input values; datalines ; 12 14 15 15 16 17 18 20 24 25 26 29 32 34 37 ; run ; /*view mean and standard deviation of dataset*/ proc means data =original_data Mean StdDev ndec= 3 ; var values; run ;
Dal risultato, possiamo vedere che la media del set di dati è 22.267 e la deviazione standard è 7.968 .
Passaggio 2: normalizzare il set di dati
Successivamente, utilizzeremo proc stdize per normalizzare il set di dati:
/*normalize the dataset*/
proc stdize data =original_data out =normalized_data;
var values;
run ;
/*print normalized dataset*/
proc print data =normalized_data;
/*view mean and standard deviation of normalized dataset*/
proc means data =normalized_data Mean StdDev ndec= 2 ;
var values;
run ;
Dal risultato, possiamo vedere che la media del set di dati normalizzato è 0 e la deviazione standard è 1 .
Passaggio 3: interpretare i dati normalizzati
SAS ha utilizzato la seguente formula per normalizzare i valori dei dati:
Valore normalizzato = (x – x ) / s
Oro:
- x = valore dei dati
- x = media del set di dati
- s = deviazione standard del set di dati
Ogni valore normalizzato ci indica il numero di deviazioni standard tra il valore dei dati originali e la media.
Ad esempio, considera il punto dati “12” nel nostro set di dati originale. La media del campione originale era 22,267 e la deviazione standard del campione originale era 7,968.
Il valore normalizzato per “12” è risultato essere -1.288, calcolato come segue:
Valore normalizzato = (x – x ) / s = (12 – 22.267) / 7.968 = -1.288
Questo ci dice che il valore “12” è 1.288 deviazioni standard inferiori alla media del set di dati originale.
Ciascuno dei valori normalizzati nel set di dati può aiutarci a capire quanto un particolare valore di dati è vicino o lontano dalla media.
Un valore normalizzato piccolo indica che un valore è vicino alla media mentre un valore normalizzato grande indica che un valore è lontano dalla media.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come utilizzare il riepilogo della procedura in SAS
Come calcolare la correlazione in SAS
Come creare tabelle di frequenza in SAS