Как использовать proc tabulate в sas (с примерами)
Вы можете использовать proc tabulate в SAS для быстрого отображения описательной статистики для одной или нескольких переменных в табличной форме.
В следующих примерах показано, как использовать эту процедуру со следующим набором данных, показывающим общее количество очков, набранных 12 разными баскетболистами:
/*create dataset*/
data my_data;
input team $position $points;
datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;
/*view dataset*/
proc print data =my_data;
Пример 1: Proc Tabulate с переменной
Мы можем использовать следующий код для расчета описательной статистики для переменной Points:
/*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
var points;
table points * (N Min Q1 Median Mean Q3 Max);
run ;
Примечание . Значения в скобках сообщают SAS, какую описательную статистику рассчитывать для баллов.
Вот некоторые из наиболее часто используемых описательных статистических данных:
- N : Общее количество наблюдений
- Мин : минимальное значение
- Q1 : Значение первого квантиля (т.е. 25-го процентиля)
- Медиана : медианное значение.
- Среднее : Среднее значение
- Q3 : Значение третьего квантиля (т.е. 75-го процентиля)
- Макс : максимальное значение
По результату мы видим:
- Общее количество наблюдений 12 .
- Минимальное количество баллов – 3 .
- Количество баллов в 25-м процентиле — 10,5 .
- Среднее количество баллов – 15,5 .
- Среднее количество баллов – 16,92 .
- Количество баллов в 75-м процентиле — 22,5 .
- Максимальное количество баллов – 34 .
Из этих пяти значений мы можем получить достаточно хорошее представление о распределении значений переменной Weight.
Пример 2: Proc Tabulate с двумя переменными
Мы можем использовать следующий код для расчета описательной статистики для переменной «очки», сгруппированной по переменной «команда»:
/*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
classteam ;
var points;
table team, points * (N Min Q1 Median Mean Q3 Max);
run ;
В полученной таблице показана описательная статистика очков для каждой из трех команд.
Например:
- Команда А имеет 6 наблюдений.
- Минимальное количество очков для Команды А составляет 9 .
- Количество очков команды А в 25-м процентиле равно 12 .
- Среднее количество очков команды А составляет 14 .
И так далее.
Пример 3: Proc Tabulate с тремя переменными
Мы можем использовать следующий код для расчета описательной статистики для переменной очков, сгруппированной по переменным команды и позиции:
/*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
var points;
table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ;
В полученной таблице показана описательная статистика очков, сгруппированная по командам и позициям.
Обратите внимание, что ячейки для команды «Б» и позиции «Атакующий» пусты, поскольку ни у одного игрока в команде Б не было позиции нападающего.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как использовать сводку процедур в SAS
Как рассчитать корреляцию в SAS
Как создать таблицы частот в SAS
Как создать коробчатые диаграммы по группам в SAS