Come utilizzare il riepilogo delle procedure in sas (con esempi)
È possibile utilizzare Riepilogo procedura in SAS per calcolare rapidamente le seguenti statistiche descrittive per una o più variabili in un set di dati:
- N : Il numero totale di osservazioni
- MIN : il valore minimo
- MAX : il valore massimo
- MEDIA : La media
- STD : deviazione standard
Gli esempi seguenti mostrano come utilizzare questa procedura con il set di dati integrato SAS chiamato Fish , che contiene varie misurazioni per 159 pesci diversi catturati in un lago in Finlandia.
Possiamo usare proc print per visualizzare le prime 10 osservazioni di questo set di dati:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Correlato: Come identificare i valori anomali in SAS
Esempio 1: riepilogo della procedura con una variabile
Possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per la variabile Peso:
/*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
Ecco come interpretare la tabella di output:
- _TYPE_: questa colonna indica se ciascuna riga del set di dati è stata utilizzata o meno per calcolare le statistiche descrittive. 0 = Ogni riga è stata utilizzata.
- _FREQ_: il numero di righe utilizzate per calcolare ciascuna statistica descrittiva.
- _STAT_: il nome della statistica descrittiva.
- Peso: il valore numerico della corrispondente statistica descrittiva.
Dal risultato possiamo vedere:
- Il numero totale di osservazioni è stato 158 .
- Il valore di peso minimo era 0 .
- Il valore massimo del peso era 1.650 .
- Il valore medio del peso era 398,70 .
- La deviazione standard dei valori di peso era 359,09 .
Da questi cinque valori possiamo comprendere abbastanza bene la distribuzione dei valori per la variabile Peso.
Esempio 2: riepilogo del processo con più variabili
Per calcolare statistiche descrittive per più variabili contemporaneamente, è sufficiente elencare più nomi di variabili nell’istruzione var .
Ad esempio, possiamo utilizzare il codice seguente per calcolare le statistiche descrittive per le variabili Peso e Altezza:
/*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/*print output dataset*/
proc print data =summaryWeightHeight;
Dal risultato possiamo vedere le cinque statistiche descrittive per peso e altezza.
Esempio 3: riepilogo del processo con una variabile raggruppata da un’altra variabile
Per calcolare le statistiche descrittive per una variabile raggruppata da un’altra variabile, possiamo utilizzare l’istruzione class .
Ad esempio, possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per il peso raggruppato per specie:
/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/*print output dataset*/
proc print data =summaryWeightSpecies;
La tabella di output mostra le statistiche descrittive per ciascuna specie di pesci.
Ad esempio, possiamo osservare le seguenti statistiche descrittive per il solo pesce Orata:
- Il numero totale di osservazioni è stato di 34 .
- Il valore di peso minimo era 242 .
- Il valore massimo del peso era 1000 .
- Il valore medio del peso era 626 .
- La deviazione standard dei valori di peso era 206,60 .
Possiamo osservare queste statistiche descrittive anche per tutte le altre specie.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come utilizzare Proc Append in SAS
Come utilizzare Proc Tabulate in SAS
Come calcolare la correlazione in SAS
Come creare tabelle di frequenza in SAS