Как рассчитать описательную статистику в sas
Описательная статистика — это значения, описывающие набор данных.
Они помогают нам понять, где находится центр набора данных, а также распределение значений в наборе данных.
Существует два распространенных способа расчета описательной статистики для переменных в SAS:
1. Используйте PROC MEANS для расчета сводной статистики.
2. Используйте PROC UNIVARIATE для расчета подробной описательной статистики.
В следующих примерах показано, как использовать каждый метод на практике со следующим набором данных в SAS:
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
Пример 1. Используйте PROC MEANS для расчета сводной статистики.
Следующий код показывает, как использовать PROC MEANS для расчета сводной статистики для переменной точек в наборе данных:
/*calculate summary statistics for points variable*/ proc means data =my_data; var points; run ;
Процедура PROC MEANS вычисляет следующую описательную статистику:
- N : Общее количество наблюдений
- Среднее : среднее значение баллов.
- Std Dev: стандартное отклонение точек.
- Минимум : минимальное значение баллов.
- Максимум : максимальное значение баллов.
Также обратите внимание, что вы можете использовать оператор класса для расчета описательной статистики для одной переменной, сгруппированной по другой переменной.
Например, мы можем использовать следующий код для расчета сводной статистики для переменной «очки» , сгруппированной по переменной «команда» :
/*calculate summary statistics for points, grouped by team*/ proc means data =my_data; classteam ; var points; run ;
В выходных данных отображается сводная статистика для переменной очков , сгруппированная по каждому уникальному значению команды .
Пример 2. Используйте PROC UNIVARIATE для расчета подробной описательной статистики.
Следующий код показывает, как использовать PROC UNIVARIATE для расчета подробной описательной статистики для переменной Points :
/*calculate detailed descriptive statistics for points variable*/ proc univariate data =my_data; var points; run ;
Процедура PROC UNIVARIATE вычисляет подробную описательную статистику для точечной переменной, включая среднее значение, медиану, моду, стандартное отклонение, дисперсию, диапазон, межквартильный размах и т. д.
Мы также можем использовать оператор класса для расчета подробной описательной статистики для переменной «очки» , сгруппированной по переменной «команда» :
/*calculate detailed descriptive statistics for points, grouped by team*/ proc univariate data =my_data; classteam ; var points; run ;
В результате будут созданы три группы выходных таблиц, которые отображают подробную описательную статистику для переменной Points , сгруппированной по каждому уникальному значению команды .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как создать таблицы частот в SAS
Как рассчитать процентили в SAS
Как создавать сводные таблицы в SAS