Як створити таблиці частот у sas (з прикладами)


Ви можете використовувати proc freq у SAS для швидкого створення таблиць частот для однієї чи кількох змінних у наборі даних.

У наведених нижче прикладах показано, як використовувати цю процедуру з вбудованим набором даних SAS під назвою BirthWgt , який містить різні характеристики 100 000 матерів, які нещодавно народили дитину.

Ми можемо використовувати proc print для відображення перших 10 спостережень цього набору даних:

 /*view first 10 observations from BirthWgt dataset*/
proc print data =sashelp.BirthWgt( obs = 10 );

run ;

Приклад 1: Таблиця частот для змінної

Ми можемо використати такий код, щоб створити таблицю частот для змінної Race:

 /*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
	Race tables ;
run ; 

частотна таблиця в SAS

Вихідна таблиця містить чотири стовпці:

  • Частота : загальна кількість спостережень, що належать до певної категорії.
  • Відсоток : відсоток загальної кількості спостережень, які належать до певної категорії.
  • Сукупна частота : загальна кількість спостережень, які були враховані до поточного рядка включно.
  • Сукупний відсоток : сукупний відсоток загальної кількості спостережень, які були враховані до поточного рядка включно.

Наприклад, з вихідної таблиці ми можемо побачити:

  • Загальна кількість іспаномовних матерів становила 22 139 осіб .
  • Загальний відсоток іспаномовних матерів становив 22,14% .
  • Загальна кількість азіатських, чорношкірих або латиноамериканських матерів становила 41 496 .
  • Загальний відсоток азіатських, темношкірих або іспаномовних матерів становив 41,50% .

Приклад 2: Таблиця частот для змінної (відсортовано)

За замовчуванням таблиці частот сортуються в алфавітному порядку на основі назв категорій. Однак ми можемо використовувати функцію order для сортування категорій за частотою:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race tables ;
run ; 

Зауважте, що категорії тепер відсортовано за частотою, від найвищої до найнижчої.

Приклад 3: таблиця частоти для змінної (включає пропущені значення)

За замовчуванням відсутні значення не включаються в частотні таблиці.

Однак ми можемо використати команду missing , щоб наказати SAS включити рядок для підрахунку частоти відсутніх значень:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race/missing tables ;
run ; 

Оскільки до таблиці частот не було додано жодних додаткових рядків, це свідчить про те, що в початковому наборі даних не було відсутніх значень для раси.

Приклад 4: Таблиця частот для кількох змінних

Щоб створити частотну таблицю для кількох змінних одночасно, ми можемо просто включити кілька імен змінних в аргумент tables .

Наприклад, ми можемо використати наступний код, щоб створити таблицю частот для раси та вікової групи:

 /*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race AgeGroup tables ;
run ; 

Ми бачимо, що для обох змінних створено частотну таблицю.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *