Sas: come utilizzare nway in proc summary
È possibile utilizzare l’istruzione NWAY in PROC SUMMARY in SAS per calcolare solo le statistiche di riepilogo a livello di gruppo anziché calcolarle per un intero set di dati.
L’esempio seguente mostra come utilizzare nella pratica l’istruzione NWAY.
Esempio: come utilizzare NWAY in PROC SUMMARY
Per questo esempio, utilizzeremo il set di dati integrato SAS chiamato Fish , che contiene varie misurazioni per 159 pesci diversi catturati in un lago in Finlandia.
Possiamo usare PROC PRINT per visualizzare le prime 10 osservazioni in questo set di dati:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Possiamo utilizzare il seguente codice con PROC SUMMARY per calcolare le statistiche descrittive per la variabile Peso , raggruppata per la variabile Specie :
/*calculate descriptive statistics for Weight, grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
Nota : nell’output sono presenti un totale di 40 righe, ma abbiamo acquisito solo uno screenshot delle prime 20 righe.
Ecco come interpretare la tabella di output:
- _TYPE_ : questa colonna indica se ciascuna riga del set di dati è stata utilizzata o meno per calcolare le statistiche descrittive. 0 = Ogni riga è stata utilizzata.
- _FREQ_ : il numero di righe utilizzate per calcolare ciascuna statistica descrittiva.
- _STAT_ : il nome della statistica descrittiva.
- Peso : il valore numerico della statistica descrittiva corrispondente.
Le prime cinque righe visualizzano le statistiche di riepilogo per il set di dati.
Per esempio:
- Il numero totale di osservazioni è stato 158 .
- Il valore di peso minimo era 0 .
- Il valore massimo del peso era 1.650 .
- Il valore medio del peso era 398,70 .
- La deviazione standard dei valori di peso era 359,09 .
Le cinque righe successive visualizzano queste statistiche di riepilogo solo per le righe nel set di dati in cui Specie è uguale a Bream .
Le cinque righe successive visualizzano queste statistiche di riepilogo solo per le righe nel set di dati in cui Specie è uguale a Parkki .
E così via.
Se utilizziamo l’istruzione NWAY in PROC SUMMARY , specifichiamo che vogliamo visualizzare solo le righe con il valore più alto nella colonna _TYPE_ dell’output.
Ciò significa che verranno visualizzate solo le righe con valore 1 nella colonna _TYPE_ . In altre parole, le prime cinque righe che mostrano le statistiche di riepilogo per il set di dati non verranno più visualizzate.
Il codice seguente mostra come utilizzare in pratica l’istruzione NWAY :
/*calculate descriptive statistics for Weight, grouped by Species*/
proc summary data =sashelp.Fish nway ;
var Weight ;
class Species;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
Tieni presente che le statistiche di riepilogo per il set di dati non vengono più visualizzate.
Vengono mostrate solo le statistiche riassuntive per le singole specie.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come utilizzare Proc Append in SAS
Come utilizzare Proc Tabulate in SAS
Come calcolare la correlazione in SAS
Come creare tabelle di frequenza in SAS