Come calcolare le statistiche descrittive in sas


Le statistiche descrittive sono valori che descrivono un insieme di dati.

Ci aiutano a capire dove si trova il centro del set di dati e la distribuzione dei valori nel set di dati.

Esistono due modi comuni per calcolare le statistiche descrittive per le variabili in SAS:

1. Utilizzare PROC MEANS per calcolare le statistiche riepilogative

2. Utilizzare PROC UNIVARIATE per calcolare statistiche descrittive dettagliate

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente set di dati in SAS:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Esempio 1. Utilizzare PROC MEANS per calcolare le statistiche riassuntive

Il codice seguente mostra come utilizzare PROC MEANS per calcolare le statistiche di riepilogo per la variabile punti nel set di dati:

 /*calculate summary statistics for points variable*/
proc means data =my_data;
    var points;
run ; 

statistica descrittiva in SAS utilizzando PROC MEANS

La procedura PROC MEANS calcola le seguenti statistiche descrittive:

  • N : Il numero totale di osservazioni
  • Media : il valore medio dei punti
  • Std Dev: la deviazione standard dei punti
  • Minimo : il valore minimo dei punti
  • Massimo : il valore massimo dei punti

Tieni inoltre presente che puoi utilizzare l’istruzione class per calcolare statistiche descrittive per una variabile, raggruppata da un’altra variabile.

Ad esempio, possiamo utilizzare il codice seguente per calcolare le statistiche riassuntive per la variabile punti , raggruppate per la variabile squadra :

 /*calculate summary statistics for points, grouped by team*/
proc means data =my_data;
    classteam ;
    var points;
run ; 

L’output visualizza le statistiche di riepilogo per la variabile punti , raggruppate per ciascuno dei valori univoci della squadra .

Esempio 2. Utilizzare PROC UNIVARIATE per calcolare statistiche descrittive dettagliate

Il codice seguente mostra come utilizzare PROC UNIVARIATE per calcolare statistiche descrittive dettagliate per la variabile points :

 /*calculate detailed descriptive statistics for points variable*/
proc univariate data =my_data;
    var points;
run ; 

La procedura PROC UNIVARIATE calcola statistiche descrittive dettagliate per la variabile punto , tra cui media, mediana, moda, deviazione standard, varianza, intervallo, intervallo interquartile, ecc.

Possiamo anche utilizzare l’istruzione class per calcolare queste statistiche descrittive dettagliate per la variabile punti , raggruppate per la variabile squadra :

 /*calculate detailed descriptive statistics for points, grouped by team*/
proc univariate data =my_data;
    classteam ;
    var points;
run ;

Ciò produrrà tre gruppi di tabelle di output che visualizzano statistiche descrittive dettagliate per la variabile punti , raggruppate in base a ciascuno dei valori univoci della squadra .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:

Come creare tabelle di frequenza in SAS
Come calcolare i percentili in SAS
Come creare tabelle pivot in SAS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *