Как использовать сводку процедур в sas (с примерами)
Вы можете использовать сводку процедур в SAS, чтобы быстро вычислить следующую описательную статистику для одной или нескольких переменных в наборе данных:
- N : Общее количество наблюдений
- МИН : Минимальное значение
- МАКС .: Максимальное значение.
- СРЕДНЕЕ : Среднее
- Стандартное отклонение : стандартное отклонение
В следующих примерах показано, как использовать эту процедуру со встроенным набором данных SAS под названием Fish , который содержит различные измерения для 159 различных рыб, пойманных в озере в Финляндии.
Мы можем использовать proc print для отображения первых 10 наблюдений этого набора данных:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Связанный: Как идентифицировать выбросы в SAS
Пример 1: Краткое описание процедуры с переменной
Мы можем использовать следующий код для расчета описательной статистики для переменной Weight:
/*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
Вот как интерпретировать выходную таблицу:
- _TYPE_: в этом столбце указывается, использовалась ли каждая строка набора данных для расчета описательной статистики. 0 = использована каждая строка.
- _FREQ_: количество строк, используемых для расчета каждой описательной статистики.
- _STAT_: Имя описательной статистики.
- Вес: числовое значение соответствующей описательной статистики.
По результату мы видим:
- Общее количество наблюдений составило 158 .
- Минимальное значение веса было 0 .
- Максимальное значение веса составило 1650 .
- Среднее значение веса составило 398,70 .
- Стандартное отклонение значений веса составило 359,09 .
Из этих пяти значений мы можем получить достаточно хорошее представление о распределении значений переменной Weight.
Пример 2: Сводная информация о процессе с несколькими переменными
Чтобы вычислить описательную статистику для нескольких переменных одновременно, просто перечислите несколько имен переменных в операторе var .
Например, мы можем использовать следующий код для расчета описательной статистики для переменных Weight и Height:
/*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/*print output dataset*/
proc print data =summaryWeightHeight;
В результате мы видим пять описательных статистических данных по весу и росту.
Пример 3: Краткое описание процесса с одной переменной, сгруппированной по другой переменной
Чтобы вычислить описательную статистику для переменной, сгруппированной по другой переменной, мы можем использовать оператор класса .
Например, мы можем использовать следующий код для расчета описательной статистики по весу, сгруппированному по видам:
/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/*print output dataset*/
proc print data =summaryWeightSpecies;
В выходной таблице отображается описательная статистика по каждому виду рыб.
Например, мы можем наблюдать следующую описательную статистику только по рыбе Лещ:
- Общее количество наблюдений составило 34 .
- Минимальное значение веса составляло 242 .
- Максимальное значение веса составляло 1000 .
- Среднее значение веса составило 626 .
- Стандартное отклонение значений веса составило 206,60 .
Мы также можем наблюдать эту описательную статистику для всех других видов.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как использовать Proc Append в SAS
Как использовать Proc Tabulate в SAS
Как рассчитать корреляцию в SAS
Как создать таблицы частот в SAS