Come utilizzare proc tabulate in sas (con esempi)


È possibile utilizzare proc tabulate in SAS per visualizzare rapidamente le statistiche descrittive per una o più variabili in formato tabellare.

Gli esempi seguenti mostrano come utilizzare questa procedura con il seguente set di dati che mostra i punti totali segnati da 12 diversi giocatori di basket:

 /*create dataset*/
data my_data;
    input team $position $points;
    datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;

/*view dataset*/
proc print data =my_data;

Esempio 1: Proc Tabulare con una variabile

Possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per la variabile points:

 /*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
    var points;
    table points * (N Min Q1 Median Mean Q3 Max);
run ; 

Nota : i valori tra parentesi indicano a SAS quali statistiche descrittive calcolare per i punti.

Ecco alcune delle statistiche descrittive più comunemente utilizzate:

  • N : Il numero totale di osservazioni
  • Min : il valore minimo
  • Q1 : Il valore del primo quantile (cioè il 25° percentile)
  • Mediana : il valore mediano
  • Media : il valore medio
  • Q3 : Il valore del terzo quantile (cioè il 75° percentile)
  • Max : il valore massimo

Dal risultato possiamo vedere:

  • Il numero totale di osservazioni è 12 .
  • Il valore minimo del punto è 3 .
  • Il numero di punti al 25° percentile è 10,5 .
  • Il numero medio di punti è 15,5 .
  • Il numero medio di punti è 16,92 .
  • Il numero di punti al 75° percentile è 22,5 .
  • Il numero massimo di punti è 34 .

Da questi cinque valori possiamo comprendere abbastanza bene la distribuzione dei valori per la variabile Peso.

Esempio 2: Proc Tabulare con due variabili

Possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per la variabile punti, raggruppate per la variabile squadra:

 /*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
    classteam ;
    var points;
    table team, points * (N Min Q1 Median Mean Q3 Max);
run ; 

La tabella risultante mostra le statistiche descrittive dei punti per ciascuna delle tre squadre.

Per esempio:

  • La squadra A ha 6 osservazioni.
  • Il valore minimo del punto per la squadra A è 9 .
  • Il numero di punti della squadra A al 25° percentile è 12 .
  • Il numero medio di punti della squadra A è 14 .

E così via.

Esempio 3: Proc Tabulare con tre variabili

Possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per la variabile punti, raggruppate per variabili di squadra e di posizione:

 /*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
    var points;
    table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ; 

La tabella risultante mostra le statistiche descrittive dei punti, raggruppati per squadra e ruolo.

Tieni presente che le celle per la squadra “B” e la posizione “Attaccante” sono vuote perché nessun giocatore della squadra B aveva una posizione di attaccante.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come utilizzare il riepilogo della procedura in SAS
Come calcolare la correlazione in SAS
Come creare tabelle di frequenza in SAS
Come creare boxplot per gruppo in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *