Come normalizzare i dati in sas


“Normalizzare” un insieme di valori di dati significa ridimensionare i valori in modo tale che la media di tutti i valori sia 0 e la deviazione standard sia 1.

Questo tutorial spiega come normalizzare i dati in SAS.

Esempio: come normalizzare i dati in SAS

Supponiamo di avere il seguente set di dati:

Completa i seguenti passaggi per normalizzare questo set di valori di dati in SAS.

Passaggio 1: crea il set di dati

Innanzitutto, utilizziamo il seguente codice per creare il set di dati in SAS:

 /*create dataset*/
data original_data;
    input values;
    datalines ;
12
14
15
15
16
17
18
20
24
25
26
29
32
34
37
;
run ;

/*view mean and standard deviation of dataset*/
proc means data =original_data Mean StdDev ndec= 3 ; 
   var values;
run ; 

Dal risultato, possiamo vedere che la media del set di dati è 22.267 e la deviazione standard è 7.968 .

Passaggio 2: normalizzare il set di dati

Successivamente, utilizzeremo proc stdize per normalizzare il set di dati:

 /*normalize the dataset*/
proc stdize data =original_data out =normalized_data;
   var values;
run ;

/*print normalized dataset*/
proc print data =normalized_data;
 
/*view mean and standard deviation of normalized dataset*/
proc means data =normalized_data Mean StdDev ndec= 2 ; 
   var values;
run ; 

Dal risultato, possiamo vedere che la media del set di dati normalizzato è 0 e la deviazione standard è 1 .

Passaggio 3: interpretare i dati normalizzati

SAS ha utilizzato la seguente formula per normalizzare i valori dei dati:

Valore normalizzato = (x – x ) / s

Oro:

  • x = valore dei dati
  • x = media del set di dati
  • s = deviazione standard del set di dati

Ogni valore normalizzato ci indica il numero di deviazioni standard tra il valore dei dati originali e la media.

Ad esempio, considera il punto dati “12” nel nostro set di dati originale. La media del campione originale era 22,267 e la deviazione standard del campione originale era 7,968.

Il valore normalizzato per “12” è risultato essere -1.288, calcolato come segue:

Valore normalizzato = (x – x ) / s = (12 – 22.267) / 7.968 = -1.288

Questo ci dice che il valore “12” è 1.288 deviazioni standard inferiori alla media del set di dati originale.

Ciascuno dei valori normalizzati nel set di dati può aiutarci a capire quanto un particolare valore di dati è vicino o lontano dalla media.

Un valore normalizzato piccolo indica che un valore è vicino alla media mentre un valore normalizzato grande indica che un valore è lontano dalla media.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come utilizzare il riepilogo della procedura in SAS
Come calcolare la correlazione in SAS
Come creare tabelle di frequenza in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *