Как создать таблицы частот в sas (с примерами)
Вы можете использовать proc freq в SAS для быстрого создания таблиц частот для одной или нескольких переменных в наборе данных.
В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием BirthWgt , который содержит различные характеристики 100 000 матерей, недавно родивших ребенка.
Мы можем использовать proc print для отображения первых 10 наблюдений этого набора данных:
/*view first 10 observations from BirthWgt dataset*/ proc print data =sashelp.BirthWgt( obs = 10 ); run ;
Пример 1: Таблица частот для переменной
Мы можем использовать следующий код для создания таблицы частот для переменной Race:
/*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
Race tables ;
run ;
Выходная таблица содержит четыре столбца:
- Частота : общее количество наблюдений, принадлежащих к определенной категории.
- Процент : процент от общего числа наблюдений, попадающих в определенную категорию.
- Кумулятивная частота : общее количество наблюдений, которые были учтены до текущей строки включительно.
- Совокупный процент : совокупный процент от общего числа наблюдений, которые были учтены до текущей строки включительно.
Например, из выходной таблицы мы видим:
- Общее число латиноамериканских матерей составило 22 139 человек .
- Общий процент латиноамериканских матерей составил 22,14% .
- Общее количество матерей азиатского, чернокожего или латиноамериканского происхождения составило 41 496 человек .
- Совокупный процент матерей азиатского, чернокожего или латиноамериканского происхождения составил 41,50% .
Пример 2: Таблица частот для переменной (отсортированная)
По умолчанию таблицы частот сортируются в алфавитном порядке по названиям категорий. Однако мы можем использовать функцию заказа для сортировки категорий по частоте:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race tables ;
run ;
Обратите внимание, что категории теперь сортируются по частоте, от самой высокой к самой низкой.
Пример 3. Таблица частот для переменной (включая пропущенные значения)
По умолчанию пропущенные значения не включаются в таблицы частот.
Однако мы можем использовать недостающую команду, чтобы указать SAS включить строку для подсчета частоты пропущенных значений:
/*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race/missing tables ;
run ;
Поскольку в таблицу частот не было добавлено никаких дополнительных строк, это говорит нам о том, что в исходном наборе данных не было пропущенных значений расы.
Пример 4: Таблица частот для нескольких переменных
Чтобы создать таблицу частот для нескольких переменных одновременно, мы можем просто включить несколько имен переменных в аргумент таблиц .
Например, мы можем использовать следующий код для создания таблицы частот для расы и возрастной группы:
/*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
Race AgeGroup tables ;
run ;
Мы видим, что для обеих переменных создана таблица частот.