Sas: як використовувати nway у proc summary
Ви можете використовувати оператор NWAY у PROC SUMMARY у SAS, щоб обчислити лише підсумкову статистику на рівні групи, а не обчислювати її для всього набору даних.
У наступному прикладі показано, як використовувати оператор NWAY на практиці.
Приклад: як використовувати NWAY у PROC SUMMARY
Для цього прикладу ми використаємо вбудований набір даних SAS під назвою Fish , який містить різні вимірювання для 159 різних риб, виловлених в озері у Фінляндії.
Ми можемо використовувати PROC PRINT для відображення перших 10 спостережень у цьому наборі даних:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Ми можемо використати наступний код із PROC SUMMARY для обчислення описової статистики для змінної Weight , згрупованої за змінною Species :
/*calculate descriptive statistics for Weight, grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
Примітка : у вихідних даних загалом 40 рядків, але ми зробили знімок лише перших 20 рядків.
Ось як інтерпретувати вихідну таблицю:
- _TYPE_ : у цьому стовпці вказується, чи використовувався кожен рядок у наборі даних для обчислення описової статистики. 0 = кожен рядок використано.
- _FREQ_ : кількість рядків, які використовуються для обчислення кожної описової статистики.
- _STAT_ : назва описової статистики.
- Вага : числове значення відповідної описової статистики.
Перші п’ять рядків відображають підсумкову статистику для набору даних.
Наприклад:
- Загальна кількість спостережень склала 158 .
- Мінімальне значення ваги було 0 .
- Максимальне значення ваги було 1650 .
- Середнє значення ваги становило 398,70 .
- Стандартне відхилення значень ваги становило 359,09 .
Наступні п’ять рядків відображають цю зведену статистику лише для рядків у наборі даних, де Вид дорівнює Лящу .
Наступні п’ять рядків відображають цю підсумкову статистику лише для рядків у наборі даних, де Species дорівнює Parkki .
І так далі.
Якщо ми використовуємо оператор NWAY у PROC SUMMARY , ми вказуємо, що ми хочемо відображати лише рядки з найвищим значенням у стовпці _TYPE_ виведення.
Це означає, що відображатимуться лише рядки зі значенням 1 у стовпці _TYPE_ . Іншими словами, перші п’ять рядків із підсумковою статистикою для набору даних більше не відображатимуться.
Наступний код показує, як використовувати оператор NWAY на практиці:
/*calculate descriptive statistics for Weight, grouped by Species*/
proc summary data =sashelp.Fish nway ;
var Weight ;
class Species;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
Зауважте, що зведена статистика для набору даних більше не відображається.
Показано лише зведену статистику для окремих видів.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як використовувати Proc Append у SAS
Як використовувати Proc Tabulate у SAS
Як розрахувати кореляцію в SAS
Як створити частотні таблиці в SAS