Come utilizzare il riepilogo delle procedure in sas (con esempi)


È possibile utilizzare Riepilogo procedura in SAS per calcolare rapidamente le seguenti statistiche descrittive per una o più variabili in un set di dati:

  • N : Il numero totale di osservazioni
  • MIN : il valore minimo
  • MAX : il valore massimo
  • MEDIA : La media
  • STD : deviazione standard

Gli esempi seguenti mostrano come utilizzare questa procedura con il set di dati integrato SAS chiamato Fish , che contiene varie misurazioni per 159 pesci diversi catturati in un lago in Finlandia.

Possiamo usare proc print per visualizzare le prime 10 osservazioni di questo set di dati:

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

Correlato: Come identificare i valori anomali in SAS

Esempio 1: riepilogo della procedura con una variabile

Possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per la variabile Peso:

 /*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
   var Weight ;
   output out =summaryWeight;
run ;

/*print output dataset*/
proc print data =summaryWeight; 

Ecco come interpretare la tabella di output:

  • _TYPE_: questa colonna indica se ciascuna riga del set di dati è stata utilizzata o meno per calcolare le statistiche descrittive. 0 = Ogni riga è stata utilizzata.
  • _FREQ_: il numero di righe utilizzate per calcolare ciascuna statistica descrittiva.
  • _STAT_: il nome della statistica descrittiva.
  • Peso: il valore numerico della corrispondente statistica descrittiva.

Dal risultato possiamo vedere:

  • Il numero totale di osservazioni è stato 158 .
  • Il valore di peso minimo era 0 .
  • Il valore massimo del peso era 1.650 .
  • Il valore medio del peso era 398,70 .
  • La deviazione standard dei valori di peso era 359,09 .

Da questi cinque valori possiamo comprendere abbastanza bene la distribuzione dei valori per la variabile Peso.

Esempio 2: riepilogo del processo con più variabili

Per calcolare statistiche descrittive per più variabili contemporaneamente, è sufficiente elencare più nomi di variabili nell’istruzione var .

Ad esempio, possiamo utilizzare il codice seguente per calcolare le statistiche descrittive per le variabili Peso e Altezza:

 /*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
   var Weight Height ;
   output out =summaryWeightHeight;
run ;

/*print output dataset*/
proc print data =summaryWeightHeight; 

Dal risultato possiamo vedere le cinque statistiche descrittive per peso e altezza.

Esempio 3: riepilogo del processo con una variabile raggruppata da un’altra variabile

Per calcolare le statistiche descrittive per una variabile raggruppata da un’altra variabile, possiamo utilizzare l’istruzione class .

Ad esempio, possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per il peso raggruppato per specie:

 /*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
   var Weight ;
   class Species;
   output out =summaryWeightSpecies;
run ;

/*print output dataset*/
proc print data =summaryWeightSpecies; 

La tabella di output mostra le statistiche descrittive per ciascuna specie di pesci.

Ad esempio, possiamo osservare le seguenti statistiche descrittive per il solo pesce Orata:

  • Il numero totale di osservazioni è stato di 34 .
  • Il valore di peso minimo era 242 .
  • Il valore massimo del peso era 1000 .
  • Il valore medio del peso era 626 .
  • La deviazione standard dei valori di peso era 206,60 .

Possiamo osservare queste statistiche descrittive anche per tutte le altre specie.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come utilizzare Proc Append in SAS
Come utilizzare Proc Tabulate in SAS
Come calcolare la correlazione in SAS
Come creare tabelle di frequenza in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *