Jak tworzyć tabele częstotliwości w sas-ie (z przykładami)
Możesz użyć proc freq w SAS-ie, aby szybko utworzyć tabele częstości dla jednej lub więcej zmiennych w zestawie danych.
Poniższe przykłady pokazują, jak używać tej procedury z wbudowanym zbiorem danych SAS o nazwie BirthWgt , który zawiera różne cechy 100 000 matek, które niedawno urodziły.
Możemy użyć proc print do wyświetlenia pierwszych 10 obserwacji tego zbioru danych:
/*view first 10 observations from BirthWgt dataset*/ proc print data =sashelp.BirthWgt( obs = 10 ); run ;
Przykład 1: Tabela częstości zmiennej
Możemy użyć następującego kodu, aby utworzyć tabelę częstości dla zmiennej Race:
/*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
Race tables ;
run ;
Tabela wyjściowa zawiera cztery kolumny:
- Częstotliwość : całkowita liczba obserwacji należących do określonej kategorii.
- Procent : Procent wszystkich obserwacji należących do określonej kategorii.
- Częstotliwość skumulowana : całkowita liczba obserwacji, które zostały uwzględnione do bieżącego wiersza włącznie.
- Skumulowany procent : Skumulowany procent wszystkich obserwacji, które zostały uwzględnione do bieżącego wiersza włącznie.
Na przykład z tabeli wyjściowej możemy zobaczyć:
- Całkowita liczba matek pochodzenia latynoskiego wyniosła 22 139 .
- Całkowity odsetek matek pochodzenia latynoskiego wyniósł 22,14% .
- Całkowita liczba matek pochodzenia azjatyckiego, czarnoskórego i latynoskiego wyniosła 41 496 .
- Skumulowany odsetek matek pochodzenia azjatyckiego, czarnego lub latynoskiego wyniósł 41,50% .
Przykład 2: Tabela częstości zmiennej (posortowana)
Domyślnie tabele częstości są sortowane alfabetycznie na podstawie nazw kategorii. Możemy jednak użyć funkcji porządkowania , aby posortować kategorie według częstotliwości:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race tables ;
run ;
Należy pamiętać, że kategorie są teraz sortowane według częstotliwości, od najwyższej do najniższej.
Przykład 3: Tabela częstości zmiennej (uwzględnij brakujące wartości)
Domyślnie brakujące wartości nie są uwzględniane w tabelach częstotliwości.
Możemy jednak użyć brakującego polecenia, aby powiedzieć SAS-owi, aby dołączył linię do zliczania częstotliwości brakujących wartości:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race/missing tables ;
run ;
Ponieważ do tabeli częstości nie dodano żadnych dodatkowych wierszy, oznacza to, że w oryginalnym zbiorze danych nie brakowało żadnych wartości rasy.
Przykład 4: Tabela częstości dla kilku zmiennych
Aby utworzyć tabelę częstości dla wielu zmiennych jednocześnie, możemy po prostu uwzględnić wiele nazw zmiennych w argumencie tabele .
Na przykład możemy użyć następującego kodu, aby utworzyć tabelę częstotliwości dla rasy i grupy wiekowej:
/*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race AgeGroup tables ;
run ;
Widzimy, że dla obu zmiennych utworzono tabelę częstości.