Come utilizzare proc tabulate in sas (con esempi)
È possibile utilizzare proc tabulate in SAS per visualizzare rapidamente le statistiche descrittive per una o più variabili in formato tabellare.
Gli esempi seguenti mostrano come utilizzare questa procedura con il seguente set di dati che mostra i punti totali segnati da 12 diversi giocatori di basket:
/*create dataset*/
data my_data;
input team $position $points;
datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;
/*view dataset*/
proc print data =my_data;
Esempio 1: Proc Tabulare con una variabile
Possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per la variabile points:
/*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
var points;
table points * (N Min Q1 Median Mean Q3 Max);
run ;
Nota : i valori tra parentesi indicano a SAS quali statistiche descrittive calcolare per i punti.
Ecco alcune delle statistiche descrittive più comunemente utilizzate:
- N : Il numero totale di osservazioni
- Min : il valore minimo
- Q1 : Il valore del primo quantile (cioè il 25° percentile)
- Mediana : il valore mediano
- Media : il valore medio
- Q3 : Il valore del terzo quantile (cioè il 75° percentile)
- Max : il valore massimo
Dal risultato possiamo vedere:
- Il numero totale di osservazioni è 12 .
- Il valore minimo del punto è 3 .
- Il numero di punti al 25° percentile è 10,5 .
- Il numero medio di punti è 15,5 .
- Il numero medio di punti è 16,92 .
- Il numero di punti al 75° percentile è 22,5 .
- Il numero massimo di punti è 34 .
Da questi cinque valori possiamo comprendere abbastanza bene la distribuzione dei valori per la variabile Peso.
Esempio 2: Proc Tabulare con due variabili
Possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per la variabile punti, raggruppate per la variabile squadra:
/*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
classteam ;
var points;
table team, points * (N Min Q1 Median Mean Q3 Max);
run ;
La tabella risultante mostra le statistiche descrittive dei punti per ciascuna delle tre squadre.
Per esempio:
- La squadra A ha 6 osservazioni.
- Il valore minimo del punto per la squadra A è 9 .
- Il numero di punti della squadra A al 25° percentile è 12 .
- Il numero medio di punti della squadra A è 14 .
E così via.
Esempio 3: Proc Tabulare con tre variabili
Possiamo utilizzare il seguente codice per calcolare le statistiche descrittive per la variabile punti, raggruppate per variabili di squadra e di posizione:
/*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
var points;
table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ;
La tabella risultante mostra le statistiche descrittive dei punti, raggruppati per squadra e ruolo.
Tieni presente che le celle per la squadra “B” e la posizione “Attaccante” sono vuote perché nessun giocatore della squadra B aveva una posizione di attaccante.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come utilizzare il riepilogo della procedura in SAS
Come calcolare la correlazione in SAS
Come creare tabelle di frequenza in SAS
Come creare boxplot per gruppo in SAS