Как использовать proc tabulate в sas (с примерами)


Вы можете использовать proc tabulate в SAS для быстрого отображения описательной статистики для одной или нескольких переменных в табличной форме.

В следующих примерах показано, как использовать эту процедуру со следующим набором данных, показывающим общее количество очков, набранных 12 разными баскетболистами:

 /*create dataset*/
data my_data;
    input team $position $points;
    datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;

/*view dataset*/
proc print data =my_data;

Пример 1: Proc Tabulate с переменной

Мы можем использовать следующий код для расчета описательной статистики для переменной Points:

 /*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
    var points;
    table points * (N Min Q1 Median Mean Q3 Max);
run ; 

Примечание . Значения в скобках сообщают SAS, какую описательную статистику рассчитывать для баллов.

Вот некоторые из наиболее часто используемых описательных статистических данных:

  • N : Общее количество наблюдений
  • Мин : минимальное значение
  • Q1 : Значение первого квантиля (т.е. 25-го процентиля)
  • Медиана : медианное значение.
  • Среднее : Среднее значение
  • Q3 : Значение третьего квантиля (т.е. 75-го процентиля)
  • Макс : максимальное значение

По результату мы видим:

  • Общее количество наблюдений 12 .
  • Минимальное количество баллов – 3 .
  • Количество баллов в 25-м процентиле — 10,5 .
  • Среднее количество баллов – 15,5 .
  • Среднее количество баллов – 16,92 .
  • Количество баллов в 75-м процентиле — 22,5 .
  • Максимальное количество баллов – 34 .

Из этих пяти значений мы можем получить достаточно хорошее представление о распределении значений переменной Weight.

Пример 2: Proc Tabulate с двумя переменными

Мы можем использовать следующий код для расчета описательной статистики для переменной «очки», сгруппированной по переменной «команда»:

 /*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
    classteam ;
    var points;
    table team, points * (N Min Q1 Median Mean Q3 Max);
run ; 

В полученной таблице показана описательная статистика очков для каждой из трех команд.

Например:

  • Команда А имеет 6 наблюдений.
  • Минимальное количество очков для Команды А составляет 9 .
  • Количество очков команды А в 25-м процентиле равно 12 .
  • Среднее количество очков команды А составляет 14 .

И так далее.

Пример 3: Proc Tabulate с тремя переменными

Мы можем использовать следующий код для расчета описательной статистики для переменной очков, сгруппированной по переменным команды и позиции:

 /*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
    var points;
    table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ; 

В полученной таблице показана описательная статистика очков, сгруппированная по командам и позициям.

Обратите внимание, что ячейки для команды «Б» и позиции «Атакующий» пусты, поскольку ни у одного игрока в команде Б не было позиции нападающего.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как использовать сводку процедур в SAS
Как рассчитать корреляцию в SAS
Как создать таблицы частот в SAS
Как создать коробчатые диаграммы по группам в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *