Come calcolare i punteggi z in sas


Nelle statistiche, un punteggio z ci dice quante deviazioni standard un valore è dalla media .

Usiamo la seguente formula per calcolare uno z-score:

z = (X – μ) / σ

Oro:

  • X è un singolo valore di dati grezzi
  • μ è la media del set di dati
  • σ è la deviazione standard del set di dati

L’esempio seguente mostra come calcolare i punteggi z per i valori dei dati grezzi in SAS.

Esempio: calcolare i punteggi Z in SAS

Supponiamo di creare il seguente set di dati in SAS:

 /*create dataset*/
data original_data;
    input values;
    datalines ;
7
12
14
12
16
18
6
7
14
17
19
22
24
13
17
12
;
run ;

/*view dataset*/
proc print data = original_data;

Supponiamo ora di voler calcolare il punteggio z per ciascun valore nel set di dati.

Possiamo usare proc sql per fare questo:

 /*create new variable that shows z-scores for each raw data value*/
proc sql ;
    select values, (values - mean(values)) / std(values) as z_scores
    from original_data;
quit ; 

Punteggi z in SAS

La colonna dei valori mostra i valori dei dati originali e la colonna z_scores mostra il punteggio z per ciascun valore.

Come interpretare i punteggi Z in SAS

Un punteggio z ci dice quante deviazioni standard un valore è dalla media.

Un punteggio z può essere positivo, negativo o zero.

Un punteggio z positivo indica che un valore particolare è superiore alla media, un punteggio z negativo indica che un valore particolare è inferiore alla media e un punteggio z pari a zero indica che un valore particolare è uguale alla media.

Se calcolassimo la media e la deviazione standard del nostro set di dati, troveremmo che la media è 14.375 e la deviazione standard è 5.162 .

Quindi il primo valore nel nostro set di dati era 7, che aveva un punteggio z di (7-14.375) / 5.162 = -1.428 . Ciò significa che il valore “7” è 1.428 deviazioni standard inferiori alla media.

Il valore successivo nei nostri dati, 12, aveva un punteggio z di (12-14,375) / 5,162 = -0,46 . Ciò significa che il valore “12” è 0,46 deviazioni standard inferiori alla media.

Quanto più un valore è lontano dalla media, tanto più alto sarà il valore assoluto del punteggio z per quel valore.

Ad esempio, il valore 7 è più lontano dalla media (14,375) rispetto al valore 12, il che spiega perché 7 aveva un punteggio z con un valore assoluto maggiore.

Risorse addizionali

I seguenti articoli spiegano come eseguire altre attività comuni in SAS:

Come identificare i valori anomali in SAS
Come calcolare i percentili in SAS
Come calcolare media, mediana e moda in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *