Как использовать сводку процедур в sas (с примерами)


Вы можете использовать сводку процедур в SAS, чтобы быстро вычислить следующую описательную статистику для одной или нескольких переменных в наборе данных:

  • N : Общее количество наблюдений
  • МИН : Минимальное значение
  • МАКС .: Максимальное значение.
  • СРЕДНЕЕ : Среднее
  • Стандартное отклонение : стандартное отклонение

В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием Fish , который содержит различные измерения для 159 различных рыб, пойманных в озере в Финляндии.

Мы можем использовать proc print для отображения первых 10 наблюдений этого набора данных:

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

Связанный: Как идентифицировать выбросы в SAS

Пример 1: Краткое описание процедуры с переменной

Мы можем использовать следующий код для расчета описательной статистики для переменной Weight:

 /*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
   var Weight ;
   output out =summaryWeight;
run ;

/*print output dataset*/
proc print data =summaryWeight; 

Вот как интерпретировать выходную таблицу:

  • _TYPE_: в этом столбце указывается, использовалась ли каждая строка набора данных для расчета описательной статистики. 0 = использована каждая строка.
  • _FREQ_: количество строк, используемых для расчета каждой описательной статистики.
  • _STAT_: Имя описательной статистики.
  • Вес: числовое значение соответствующей описательной статистики.

По результату мы видим:

  • Общее количество наблюдений составило 158 .
  • Минимальное значение веса было 0 .
  • Максимальное значение веса составило 1650 .
  • Среднее значение веса составило 398,70 .
  • Стандартное отклонение значений веса составило 359,09 .

Из этих пяти значений мы можем получить достаточно хорошее представление о распределении значений переменной Weight.

Пример 2: Сводная информация о процессе с несколькими переменными

Чтобы вычислить описательную статистику для нескольких переменных одновременно, просто перечислите несколько имен переменных в операторе var .

Например, мы можем использовать следующий код для расчета описательной статистики для переменных Weight и Height:

 /*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
   var Weight Height ;
   output out =summaryWeightHeight;
run ;

/*print output dataset*/
proc print data =summaryWeightHeight; 

В результате мы видим пять описательных статистических данных по весу и росту.

Пример 3: Краткое описание процесса с одной переменной, сгруппированной по другой переменной

Чтобы вычислить описательную статистику для переменной, сгруппированной по другой переменной, мы можем использовать оператор класса .

Например, мы можем использовать следующий код для расчета описательной статистики по весу, сгруппированному по видам:

 /*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
   var Weight ;
   class Species;
   output out =summaryWeightSpecies;
run ;

/*print output dataset*/
proc print data =summaryWeightSpecies; 

В выходной таблице отображается описательная статистика по каждому виду рыб.

Например, мы можем наблюдать следующую описательную статистику только по рыбе Лещ:

  • Общее количество наблюдений составило 34 .
  • Минимальное значение веса составляло 242 .
  • Максимальное значение веса составляло 1000 .
  • Среднее значение веса составило 626 .
  • Стандартное отклонение значений веса составило 206,60 .

Мы также можем наблюдать эту описательную статистику для всех других видов.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как использовать Proc Append в SAS
Как использовать Proc Tabulate в SAS
Как рассчитать корреляцию в SAS
Как создать таблицы частот в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *