Як використовувати зведення процедур у sas (з прикладами)
Ви можете використовувати Procedure Summary у SAS, щоб швидко обчислити наступну описову статистику для однієї або кількох змінних у наборі даних:
- N : Загальна кількість спостережень
- MIN : мінімальне значення
- MAX : максимальне значення
- AVERAGE : середнє значення
- STD : стандартне відхилення
У наведених нижче прикладах показано, як використовувати цю процедуру з вбудованим набором даних SAS під назвою Fish , який містить різні вимірювання для 159 різних риб, виловлених в озері у Фінляндії.
Ми можемо використовувати proc print для відображення перших 10 спостережень цього набору даних:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Пов’язане: Як визначити викиди в SAS
Приклад 1: Короткий опис процедури зі змінною
Ми можемо використати наступний код для обчислення описової статистики для змінної Weight:
/*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
Ось як інтерпретувати вихідну таблицю:
- _TYPE_: у цьому стовпці вказується, чи використовувався кожен рядок у наборі даних для обчислення описової статистики. 0 = кожен рядок використано.
- _FREQ_: кількість рядків, які використовуються для обчислення кожної описової статистики.
- _STAT_: назва описової статистики.
- Вага: числове значення відповідної описової статистики.
З результату ми бачимо:
- Загальна кількість спостережень склала 158 .
- Мінімальне значення ваги було 0 .
- Максимальне значення ваги було 1650 .
- Середнє значення ваги становило 398,70 .
- Стандартне відхилення значень ваги становило 359,09 .
З цих п’яти значень ми можемо отримати досить добре розуміння розподілу значень для змінної Weight.
Приклад 2: Зведення процесу з кількома змінними
Щоб обчислити описову статистику для кількох змінних одночасно, просто вкажіть кілька імен змінних у операторі var .
Наприклад, ми можемо використати такий код для обчислення описової статистики для змінних Weight і Height:
/*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/*print output dataset*/
proc print data =summaryWeightHeight;
З результату ми можемо побачити п’ять описових статистичних даних щодо ваги та зросту.
Приклад 3: Підсумок процесу з однією змінною, згрупованою іншою змінною
Щоб обчислити описову статистику для змінної, згрупованої іншою змінною, ми можемо використати оператор класу .
Наприклад, ми можемо використовувати наступний код для обчислення описової статистики для ваги, згрупованої за видами:
/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/*print output dataset*/
proc print data =summaryWeightSpecies;
Вихідна таблиця відображає описову статистику для кожного виду риби.
Наприклад, ми можемо спостерігати наступну описову статистику лише для риби Лящ:
- Загальна кількість спостережень склала 34 .
- Мінімальне значення ваги було 242 .
- Максимальне значення ваги було 1000 .
- Середнє значення ваги становило 626 .
- Стандартне відхилення значень ваги становило 206,60 .
Ми також можемо спостерігати цю описову статистику для всіх інших видів.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як використовувати Proc Append у SAS
Як використовувати Proc Tabulate у SAS
Як розрахувати кореляцію в SAS
Як створити частотні таблиці в SAS