Как создать таблицы частот в sas (с примерами)


Вы можете использовать proc freq в SAS для быстрого создания таблиц частот для одной или нескольких переменных в наборе данных.

В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием BirthWgt , который содержит различные характеристики 100 000 матерей, недавно родивших ребенка.

Мы можем использовать proc print для отображения первых 10 наблюдений этого набора данных:

 /*view first 10 observations from BirthWgt dataset*/
proc print data =sashelp.BirthWgt( obs = 10 );

run ;

Пример 1: Таблица частот для переменной

Мы можем использовать следующий код для создания таблицы частот для переменной Race:

 /*create frequency table for Race variable*/
proc freq data =sashelp.BirthWgt;
	Race tables ;
run ; 

таблица частот в SAS

Выходная таблица содержит четыре столбца:

  • Частота : общее количество наблюдений, принадлежащих к определенной категории.
  • Процент : процент от общего числа наблюдений, попадающих в определенную категорию.
  • Кумулятивная частота : общее количество наблюдений, которые были учтены до текущей строки включительно.
  • Совокупный процент : совокупный процент от общего числа наблюдений, которые были учтены до текущей строки включительно.

Например, из выходной таблицы мы видим:

  • Общее число латиноамериканских матерей составило 22 139 человек .
  • Общий процент латиноамериканских матерей составил 22,14% .
  • Общее количество матерей азиатского, чернокожего или латиноамериканского происхождения составило 41 496 человек .
  • Совокупный процент матерей азиатского, чернокожего или латиноамериканского происхождения составил 41,50% .

Пример 2: Таблица частот для переменной (отсортированная)

По умолчанию таблицы частот сортируются в алфавитном порядке по названиям категорий. Однако мы можем использовать функцию заказа для сортировки категорий по частоте:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race tables ;
run ; 

Обратите внимание, что категории теперь сортируются по частоте, от самой высокой к самой низкой.

Пример 3. Таблица частот для переменной (включая пропущенные значения)

По умолчанию пропущенные значения не включаются в таблицы частот.

Однако мы можем использовать недостающую команду, чтобы указать SAS включить строку для подсчета частоты пропущенных значений:

 /*create frequency table for Race variable, sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race/missing tables ;
run ; 

Поскольку в таблицу частот не было добавлено никаких дополнительных строк, это говорит нам о том, что в исходном наборе данных не было пропущенных значений расы.

Пример 4: Таблица частот для нескольких переменных

Чтобы создать таблицу частот для нескольких переменных одновременно, мы можем просто включить несколько имен переменных в аргумент таблиц .

Например, мы можем использовать следующий код для создания таблицы частот для расы и возрастной группы:

 /*create frequency table for Race and AgeGroup variables, both sorted by frequency*/
proc freq data =sashelp.BirthWgt order =freq;
	Race AgeGroup tables ;
run ; 

Мы видим, что для обеих переменных создана таблица частот.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *