Jak tworzyć tabele częstotliwości w sas-ie (z przykładami)


Możesz użyć proc freq w SAS-ie, aby szybko utworzyć tabele częstości dla jednej lub więcej zmiennych w zestawie danych.

Poniższe przykłady pokazują, jak używać tej procedury z wbudowanym zbiorem danych SAS o nazwie BirthWgt , który zawiera różne cechy 100 000 matek, które niedawno urodziły.

Możemy użyć proc print do wyświetlenia pierwszych 10 obserwacji tego zbioru danych:

 /*view first 10 observations from BirthWgt dataset*/
proc print data =sashelp.BirthWgt( obs = 10 );

run ;

Przykład 1: Tabela częstości zmiennej

Możemy użyć następującego kodu, aby utworzyć tabelę częstości dla zmiennej Race:

 /*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
	Race tables ;
run ; 

tabela częstotliwości w SAS

Tabela wyjściowa zawiera cztery kolumny:

  • Częstotliwość : całkowita liczba obserwacji należących do określonej kategorii.
  • Procent : Procent wszystkich obserwacji należących do określonej kategorii.
  • Częstotliwość skumulowana : całkowita liczba obserwacji, które zostały uwzględnione do bieżącego wiersza włącznie.
  • Skumulowany procent : Skumulowany procent wszystkich obserwacji, które zostały uwzględnione do bieżącego wiersza włącznie.

Na przykład z tabeli wyjściowej możemy zobaczyć:

  • Całkowita liczba matek pochodzenia latynoskiego wyniosła 22 139 .
  • Całkowity odsetek matek pochodzenia latynoskiego wyniósł 22,14% .
  • Całkowita liczba matek pochodzenia azjatyckiego, czarnoskórego i latynoskiego wyniosła 41 496 .
  • Skumulowany odsetek matek pochodzenia azjatyckiego, czarnego lub latynoskiego wyniósł 41,50% .

Przykład 2: Tabela częstości zmiennej (posortowana)

Domyślnie tabele częstości są sortowane alfabetycznie na podstawie nazw kategorii. Możemy jednak użyć funkcji porządkowania , aby posortować kategorie według częstotliwości:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race tables ;
run ; 

Należy pamiętać, że kategorie są teraz sortowane według częstotliwości, od najwyższej do najniższej.

Przykład 3: Tabela częstości zmiennej (uwzględnij brakujące wartości)

Domyślnie brakujące wartości nie są uwzględniane w tabelach częstotliwości.

Możemy jednak użyć brakującego polecenia, aby powiedzieć SAS-owi, aby dołączył linię do zliczania częstotliwości brakujących wartości:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race/missing tables ;
run ; 

Ponieważ do tabeli częstości nie dodano żadnych dodatkowych wierszy, oznacza to, że w oryginalnym zbiorze danych nie brakowało żadnych wartości rasy.

Przykład 4: Tabela częstości dla kilku zmiennych

Aby utworzyć tabelę częstości dla wielu zmiennych jednocześnie, możemy po prostu uwzględnić wiele nazw zmiennych w argumencie tabele .

Na przykład możemy użyć następującego kodu, aby utworzyć tabelę częstotliwości dla rasy i grupy wiekowej:

 /*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race AgeGroup tables ;
run ; 

Widzimy, że dla obu zmiennych utworzono tabelę częstości.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *