Sas: come utilizzare proc univariata per i test di normalità


È possibile utilizzare proc univariate in SAS con l’istruzione normal per eseguire più test di normalità su una variabile in un set di dati.

Questa procedura utilizza la seguente sintassi di base:

 proc univariate data =my_data normal ;
    var my_variable;
run ;

L’esempio seguente mostra come utilizzare questa procedura nella pratica.

Esempio: Proc Univariate per test di normalità in SAS

Supponiamo di avere il seguente set di dati in SAS che contiene informazioni su vari giocatori di basket:

 /*create dataset*/
data my_data;
    input team $pointsrebounds;
    datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;

/*view dataset*/
proc print data =my_data;

Possiamo usare proc univariate con l’istruzione normal per eseguire vari test di normalità sulla variabile points :

 proc univariate data =my_data normal ;
    var points;
run ;

Nel risultato verranno visualizzate diverse tabelle, ma quella intitolata Test di normalità contiene i risultati dei test di normalità:

SAS proc test di normalità univariata

Per impostazione predefinita, SAS esegue quattro test di normalità e visualizza ciascuna statistica di test e i corrispondenti valori p:

  • Test di Shapiro-Wilk : W = 0,867, p = 0,0383
  • Test di Kolmogorov-Smirnov : D = 0,237, p = 0,0318
  • Test di Cramer-von Mises : W-Sq = 0,152, p = 0,0200
  • Test di Anderson-Darling : A-Sq = 0,847, p = 0,0223

Ogni test di normalità utilizza le seguenti ipotesi nulle e alternative:

  • H 0 : i dati sono distribuiti normalmente.
  • H A : I dati non sono distribuiti normalmente.

Poiché il valore p per ciascun test di normalità è inferiore a 0,05, rifiuteremo l’ipotesi nulla per ciascun test di normalità.

Ciò significa che ci sono prove sufficienti per concludere che la variabile punti non è distribuita normalmente.

Tieni presente che puoi anche creare un istogramma con una curva normale sovrapposta per visualizzare la distribuzione dei valori della variabile punti :

 proc univariate data =my_data;
    histogram points / normal ;
run ; 

L’istogramma ci mostra che la distribuzione dei valori non segue molto bene la curva normale, il che concorda con i risultati dei test di normalità che abbiamo effettuato.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come utilizzare il riepilogo della procedura in SAS
Come utilizzare Proc Tabulate in SAS
Come utilizzare le regole di confronto Proc in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *