Як використовувати proc tabulate у sas (з прикладами)


Ви можете використовувати proc tabulate у SAS для швидкого відображення описової статистики для однієї чи кількох змінних у табличній формі.

У наведених нижче прикладах показано, як використовувати цю процедуру з таким набором даних, який показує загальну кількість очок, набраних 12 різними баскетболістами:

 /*create dataset*/
data my_data;
    input team $position $points;
    datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;

/*view dataset*/
proc print data =my_data;

Приклад 1: Proc Tabulate зі змінною

Ми можемо використовувати наступний код для обчислення описової статистики для змінної Points:

 /*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
    var points;
    table points * (N Min Q1 Median Mean Q3 Max);
run ; 

Примітка . Значення в дужках повідомляють SAS, яку описову статистику обчислювати для балів.

Ось деякі з найбільш часто використовуваних описових статистичних даних:

  • N : Загальна кількість спостережень
  • Min : мінімальне значення
  • Q1 : значення першого квантиля (тобто 25-го процентиля)
  • Медіана : середнє значення
  • Середнє : середнє значення
  • Q3 : значення третього квантиля (тобто 75-го процентиля)
  • Max : максимальне значення

З результату ми бачимо:

  • Загальна кількість спостережень 12 .
  • Мінімальна кількість балів – 3 .
  • Кількість балів на 25 процентилі становить 10,5 .
  • Середня кількість балів – 15,5 .
  • Середня кількість балів 16,92 .
  • Кількість балів на 75 процентилі становить 22,5 .
  • Максимальна кількість балів 34 .

З цих п’яти значень ми можемо отримати досить добре розуміння розподілу значень для змінної Weight.

Приклад 2: таблиця Proc із двома змінними

Ми можемо використати наступний код для обчислення описової статистики для змінної балів, згрупованої за змінною team:

 /*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
    classteam ;
    var points;
    table team, points * (N Min Q1 Median Mean Q3 Max);
run ; 

Отримана таблиця показує описову статистику очок для кожної з трьох команд.

Наприклад:

  • Команда А має 6 спостережень.
  • Мінімальна кількість балів для команди А становить 9 .
  • Кількість очок команди А на 25 процентилі становить 12 .
  • Середня кількість очок команди А становить 14 .

І так далі.

Приклад 3: таблиця Proc з трьома змінними

Ми можемо використати наступний код для обчислення описової статистики для змінної очок, згрупованих за змінними команди та позиції:

 /*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
    var points;
    table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ; 

Отримана таблиця показує описову статистику очок, згрупованих за командами та позиціями.

Зауважте, що клітинки для команди «B» і позиції «Нападаючий» порожні, оскільки жоден гравець у команді B не мав позиції нападника.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як використовувати зведення процедур у SAS
Як розрахувати кореляцію в SAS
Як створити частотні таблиці в SAS
Як створити коробкові діаграми за групою в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *