Come creare tabelle di frequenza in sas (con esempi)
È possibile utilizzare proc freq in SAS per creare rapidamente tabelle di frequenza per una o più variabili in un set di dati.
Gli esempi seguenti mostrano come utilizzare questa procedura con il set di dati integrato in SAS chiamato BirthWgt , che contiene varie caratteristiche di 100.000 madri che hanno partorito di recente.
Possiamo usare proc print per visualizzare le prime 10 osservazioni di questo set di dati:
/*view first 10 observations from BirthWgt dataset*/ proc print data =sashelp.BirthWgt( obs = 10 ); run ;
Esempio 1: tabella di frequenza per una variabile
Possiamo usare il seguente codice per creare una tabella di frequenza per la variabile Race:
/*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
Race tables ;
run ;
La tabella di output contiene quattro colonne:
- Frequenza : il numero totale di osservazioni appartenenti ad una determinata categoria.
- Percentuale : la percentuale delle osservazioni totali che rientrano in una determinata categoria.
- Frequenza cumulativa : numero totale di osservazioni considerate fino alla riga corrente inclusa.
- Percentuale cumulativa : la percentuale cumulativa delle osservazioni totali considerate fino alla riga corrente inclusa.
Ad esempio dalla tabella di output possiamo vedere:
- Il numero totale di madri ispaniche era di 22.139 .
- La percentuale totale di madri ispaniche era del 22,14% .
- Il numero totale di madri asiatiche, nere o ispaniche era 41.496 .
- La percentuale cumulativa di madri asiatiche, nere o ispaniche era del 41,50% .
Esempio 2: tabella di frequenza per una variabile (ordinata)
Per impostazione predefinita, le tabelle di frequenza sono ordinate alfabeticamente in base ai nomi delle categorie. Tuttavia, possiamo utilizzare la funzione di ordine per ordinare le categorie in base alla frequenza:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race tables ;
run ;
Tieni presente che le categorie ora sono ordinate in base alla frequenza, dalla più alta alla più bassa.
Esempio 3: tabella di frequenza per una variabile (include valori mancanti)
Per impostazione predefinita, i valori mancanti non sono inclusi nelle tabelle di frequenza.
Tuttavia, possiamo usare il comando mancante per dire a SAS di includere una riga per contare la frequenza dei valori mancanti:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race/missing tables ;
run ;
Poiché non sono state aggiunte ulteriori righe alla tabella delle frequenze, ciò ci dice che non c’erano valori mancanti per la razza nel set di dati originale.
Esempio 4: tabella di frequenza per più variabili
Per creare una tabella di frequenza per più variabili contemporaneamente, possiamo semplicemente includere più nomi di variabili nell’argomento tables .
Ad esempio, possiamo utilizzare il codice seguente per creare una tabella di frequenza per Race e AgeGroup:
/*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race AgeGroup tables ;
run ;
Possiamo vedere che è stata creata una tabella di frequenza per entrambe le variabili.