Sas: как отобразить iqr в proc means
Вы можете использовать PROC MEANS для расчета сводной статистики для переменных в SAS.
По умолчанию PROC MEANS не отображает межквартильный размах (IQR) в качестве одной из сводных статистических данных, но вы можете использовать оператор QRANGE , чтобы включить IQR в выходные данные:
proc means data =my_data N Mean QRANGE Std Min Max ; var points; run ;
В этом конкретном примере вычисляется общее количество наблюдений, среднее значение, межквартильный размах, стандартное отклонение, минимальное и максимальное значения для переменной, называемой точками .
В следующем примере показано, как использовать этот синтаксис на практике.
Пример. Отображение IQR в PROC MEANS в SAS.
Предположим, у нас есть следующий набор данных в SAS, содержащий информацию о различных баскетболистах:
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
Предположим, мы используем PROC MEANS для расчета сводной статистики для переменной точек в наборе данных:
/*calculate summary statistics for points variable*/ proc means data =my_data; var points; run ;
По умолчанию PROC MEANS вычисляет следующую описательную статистику:
- N : Общее количество наблюдений
- Среднее : среднее значение баллов.
- Std Dev: стандартное отклонение точек.
- Минимум : минимальное значение баллов.
- Максимум : максимальное значение баллов.
Обратите внимание, что IQR не включается в выходные данные.
Мы можем использовать следующий синтаксис, чтобы включить IQR в выходные данные:
/*calculate summary statistics for points and include IQR*/ proc means data =my_data N Mean QRANGE Std Min Max ; var points; run ;
Обратите внимание, что выходные данные теперь включают значение межквартильного диапазона для переменной точек .
Мы видим, что IQR для переменной Points оказывается равным 13 .
Помните, что IQR представляет собой разницу между 75-м и 25-м процентилем для данной переменной.
Если вы хотите увидеть значения этих процентилей, вы можете включить P25 и P75 в процедуру PROC MEANS :
/*calculate summary statistics for points and include IQR*/ proc means data =my_data N Mean P25 P75 QRANGE Std Min Max ; var points; run ;
Теперь выходные данные включают 25-й процентиль, 75-й процентиль и межквартильный диапазон для переменной «баллы» .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как рассчитать описательную статистику в SAS
Как создать таблицы частот в SAS
Как рассчитать процентили в SAS
Как создавать сводные таблицы в SAS