Як використовувати зведення процедур у sas (з прикладами)


Ви можете використовувати Procedure Summary у SAS, щоб швидко обчислити наступну описову статистику для однієї або кількох змінних у наборі даних:

  • N : Загальна кількість спостережень
  • MIN : мінімальне значення
  • MAX : максимальне значення
  • AVERAGE : середнє значення
  • STD : стандартне відхилення

У наведених нижче прикладах показано, як використовувати цю процедуру з вбудованим набором даних SAS під назвою Fish , який містить різні вимірювання для 159 різних риб, виловлених в озері у Фінляндії.

Ми можемо використовувати proc print для відображення перших 10 спостережень цього набору даних:

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

Пов’язане: Як визначити викиди в SAS

Приклад 1: Короткий опис процедури зі змінною

Ми можемо використати наступний код для обчислення описової статистики для змінної Weight:

 /*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
   var Weight ;
   output out =summaryWeight;
run ;

/*print output dataset*/
proc print data =summaryWeight; 

Ось як інтерпретувати вихідну таблицю:

  • _TYPE_: у цьому стовпці вказується, чи використовувався кожен рядок у наборі даних для обчислення описової статистики. 0 = кожен рядок використано.
  • _FREQ_: кількість рядків, які використовуються для обчислення кожної описової статистики.
  • _STAT_: назва описової статистики.
  • Вага: числове значення відповідної описової статистики.

З результату ми бачимо:

  • Загальна кількість спостережень склала 158 .
  • Мінімальне значення ваги було 0 .
  • Максимальне значення ваги було 1650 .
  • Середнє значення ваги становило 398,70 .
  • Стандартне відхилення значень ваги становило 359,09 .

З цих п’яти значень ми можемо отримати досить добре розуміння розподілу значень для змінної Weight.

Приклад 2: Зведення процесу з кількома змінними

Щоб обчислити описову статистику для кількох змінних одночасно, просто вкажіть кілька імен змінних у операторі var .

Наприклад, ми можемо використати такий код для обчислення описової статистики для змінних Weight і Height:

 /*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
   var Weight Height ;
   output out =summaryWeightHeight;
run ;

/*print output dataset*/
proc print data =summaryWeightHeight; 

З результату ми можемо побачити п’ять описових статистичних даних щодо ваги та зросту.

Приклад 3: Підсумок процесу з однією змінною, згрупованою іншою змінною

Щоб обчислити описову статистику для змінної, згрупованої іншою змінною, ми можемо використати оператор класу .

Наприклад, ми можемо використовувати наступний код для обчислення описової статистики для ваги, згрупованої за видами:

 /*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
   var Weight ;
   class Species;
   output out =summaryWeightSpecies;
run ;

/*print output dataset*/
proc print data =summaryWeightSpecies; 

Вихідна таблиця відображає описову статистику для кожного виду риби.

Наприклад, ми можемо спостерігати наступну описову статистику лише для риби Лящ:

  • Загальна кількість спостережень склала 34 .
  • Мінімальне значення ваги було 242 .
  • Максимальне значення ваги було 1000 .
  • Середнє значення ваги становило 626 .
  • Стандартне відхилення значень ваги становило 206,60 .

Ми також можемо спостерігати цю описову статистику для всіх інших видів.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як використовувати Proc Append у SAS
Як використовувати Proc Tabulate у SAS
Як розрахувати кореляцію в SAS
Як створити частотні таблиці в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *