Sas: як використовувати nway у proc summary


Ви можете використовувати оператор NWAY у PROC SUMMARY у SAS, щоб обчислити лише підсумкову статистику на рівні групи, а не обчислювати її для всього набору даних.

У наступному прикладі показано, як використовувати оператор NWAY на практиці.

Приклад: як використовувати NWAY у PROC SUMMARY

Для цього прикладу ми використаємо вбудований набір даних SAS під назвою Fish , який містить різні вимірювання для 159 різних риб, виловлених в озері у Фінляндії.

Ми можемо використовувати PROC PRINT для відображення перших 10 спостережень у цьому наборі даних:

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

Ми можемо використати наступний код із PROC SUMMARY для обчислення описової статистики для змінної Weight , згрупованої за змінною Species :

 /*calculate descriptive statistics for Weight, grouped by Species*/
proc summary data =sashelp.Fish;
    var Weight ;
    class Species;  
    output out =summaryWeight;
run ;

/*print output dataset*/
proc print data =summaryWeight; 

Примітка : у вихідних даних загалом 40 рядків, але ми зробили знімок лише перших 20 рядків.

Ось як інтерпретувати вихідну таблицю:

  • _TYPE_ : у цьому стовпці вказується, чи використовувався кожен рядок у наборі даних для обчислення описової статистики. 0 = кожен рядок використано.
  • _FREQ_ : кількість рядків, які використовуються для обчислення кожної описової статистики.
  • _STAT_ : назва описової статистики.
  • Вага : числове значення відповідної описової статистики.

Перші п’ять рядків відображають підсумкову статистику для набору даних.

Наприклад:

  • Загальна кількість спостережень склала 158 .
  • Мінімальне значення ваги було 0 .
  • Максимальне значення ваги було 1650 .
  • Середнє значення ваги становило 398,70 .
  • Стандартне відхилення значень ваги становило 359,09 .

Наступні п’ять рядків відображають цю зведену статистику лише для рядків у наборі даних, де Вид дорівнює Лящу .

Наступні п’ять рядків відображають цю підсумкову статистику лише для рядків у наборі даних, де Species дорівнює Parkki .

І так далі.

Якщо ми використовуємо оператор NWAY у PROC SUMMARY , ми вказуємо, що ми хочемо відображати лише рядки з найвищим значенням у стовпці _TYPE_ виведення.

Це означає, що відображатимуться лише рядки зі значенням 1 у стовпці _TYPE_ . Іншими словами, перші п’ять рядків із підсумковою статистикою для набору даних більше не відображатимуться.

Наступний код показує, як використовувати оператор NWAY на практиці:

 /*calculate descriptive statistics for Weight, grouped by Species*/
proc summary data =sashelp.Fish nway ;
    var Weight ;
    class Species;  
    output out =summaryWeight;
run ;

/*print output dataset*/
proc print data =summaryWeight; 

Зауважте, що зведена статистика для набору даних більше не відображається.

Показано лише зведену статистику для окремих видів.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як використовувати Proc Append у SAS
Як використовувати Proc Tabulate у SAS
Як розрахувати кореляцію в SAS
Як створити частотні таблиці в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *