Як створити таблиці частот у sas (з прикладами)
Ви можете використовувати proc freq у SAS для швидкого створення таблиць частот для однієї чи кількох змінних у наборі даних.
У наведених нижче прикладах показано, як використовувати цю процедуру з вбудованим набором даних SAS під назвою BirthWgt , який містить різні характеристики 100 000 матерів, які нещодавно народили дитину.
Ми можемо використовувати proc print для відображення перших 10 спостережень цього набору даних:
/*view first 10 observations from BirthWgt dataset*/ proc print data =sashelp.BirthWgt( obs = 10 ); run ;
Приклад 1: Таблиця частот для змінної
Ми можемо використати такий код, щоб створити таблицю частот для змінної Race:
/*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
Race tables ;
run ;
Вихідна таблиця містить чотири стовпці:
- Частота : загальна кількість спостережень, що належать до певної категорії.
- Відсоток : відсоток загальної кількості спостережень, які належать до певної категорії.
- Сукупна частота : загальна кількість спостережень, які були враховані до поточного рядка включно.
- Сукупний відсоток : сукупний відсоток загальної кількості спостережень, які були враховані до поточного рядка включно.
Наприклад, з вихідної таблиці ми можемо побачити:
- Загальна кількість іспаномовних матерів становила 22 139 осіб .
- Загальний відсоток іспаномовних матерів становив 22,14% .
- Загальна кількість азіатських, чорношкірих або латиноамериканських матерів становила 41 496 .
- Загальний відсоток азіатських, темношкірих або іспаномовних матерів становив 41,50% .
Приклад 2: Таблиця частот для змінної (відсортовано)
За замовчуванням таблиці частот сортуються в алфавітному порядку на основі назв категорій. Однак ми можемо використовувати функцію order для сортування категорій за частотою:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race tables ;
run ;
Зауважте, що категорії тепер відсортовано за частотою, від найвищої до найнижчої.
Приклад 3: таблиця частоти для змінної (включає пропущені значення)
За замовчуванням відсутні значення не включаються в частотні таблиці.
Однак ми можемо використати команду missing , щоб наказати SAS включити рядок для підрахунку частоти відсутніх значень:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race/missing tables ;
run ;
Оскільки до таблиці частот не було додано жодних додаткових рядків, це свідчить про те, що в початковому наборі даних не було відсутніх значень для раси.
Приклад 4: Таблиця частот для кількох змінних
Щоб створити частотну таблицю для кількох змінних одночасно, ми можемо просто включити кілька імен змінних в аргумент tables .
Наприклад, ми можемо використати наступний код, щоб створити таблицю частот для раси та вікової групи:
/*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race AgeGroup tables ;
run ;
Ми бачимо, що для обох змінних створено частотну таблицю.