Як використовувати proc tabulate у sas (з прикладами)
Ви можете використовувати proc tabulate у SAS для швидкого відображення описової статистики для однієї чи кількох змінних у табличній формі.
У наведених нижче прикладах показано, як використовувати цю процедуру з таким набором даних, який показує загальну кількість очок, набраних 12 різними баскетболістами:
/*create dataset*/
data my_data;
input team $position $points;
datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;
/*view dataset*/
proc print data =my_data;
Приклад 1: Proc Tabulate зі змінною
Ми можемо використовувати наступний код для обчислення описової статистики для змінної Points:
/*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
var points;
table points * (N Min Q1 Median Mean Q3 Max);
run ;
Примітка . Значення в дужках повідомляють SAS, яку описову статистику обчислювати для балів.
Ось деякі з найбільш часто використовуваних описових статистичних даних:
- N : Загальна кількість спостережень
- Min : мінімальне значення
- Q1 : значення першого квантиля (тобто 25-го процентиля)
- Медіана : середнє значення
- Середнє : середнє значення
- Q3 : значення третього квантиля (тобто 75-го процентиля)
- Max : максимальне значення
З результату ми бачимо:
- Загальна кількість спостережень 12 .
- Мінімальна кількість балів – 3 .
- Кількість балів на 25 процентилі становить 10,5 .
- Середня кількість балів – 15,5 .
- Середня кількість балів 16,92 .
- Кількість балів на 75 процентилі становить 22,5 .
- Максимальна кількість балів 34 .
З цих п’яти значень ми можемо отримати досить добре розуміння розподілу значень для змінної Weight.
Приклад 2: таблиця Proc із двома змінними
Ми можемо використати наступний код для обчислення описової статистики для змінної балів, згрупованої за змінною team:
/*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
classteam ;
var points;
table team, points * (N Min Q1 Median Mean Q3 Max);
run ;
Отримана таблиця показує описову статистику очок для кожної з трьох команд.
Наприклад:
- Команда А має 6 спостережень.
- Мінімальна кількість балів для команди А становить 9 .
- Кількість очок команди А на 25 процентилі становить 12 .
- Середня кількість очок команди А становить 14 .
І так далі.
Приклад 3: таблиця Proc з трьома змінними
Ми можемо використати наступний код для обчислення описової статистики для змінної очок, згрупованих за змінними команди та позиції:
/*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
var points;
table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ;
Отримана таблиця показує описову статистику очок, згрупованих за командами та позиціями.
Зауважте, що клітинки для команди «B» і позиції «Нападаючий» порожні, оскільки жоден гравець у команді B не мав позиції нападника.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як використовувати зведення процедур у SAS
Як розрахувати кореляцію в SAS
Як створити частотні таблиці в SAS
Як створити коробкові діаграми за групою в SAS