Sas: как отобразить iqr в proc means


Вы можете использовать PROC MEANS для расчета сводной статистики для переменных в SAS.

По умолчанию PROC MEANS не отображает межквартильный размах (IQR) в качестве одной из сводных статистических данных, но вы можете использовать оператор QRANGE , чтобы включить IQR в выходные данные:

 proc means data =my_data N Mean QRANGE Std Min Max ;
    var points;
run ;

В этом конкретном примере вычисляется общее количество наблюдений, среднее значение, межквартильный размах, стандартное отклонение, минимальное и максимальное значения для переменной, называемой точками .

В следующем примере показано, как использовать этот синтаксис на практике.

Пример. Отображение IQR в PROC MEANS в SAS.

Предположим, у нас есть следующий набор данных в SAS, содержащий информацию о различных баскетболистах:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Предположим, мы используем PROC MEANS для расчета сводной статистики для переменной точек в наборе данных:

 /*calculate summary statistics for points variable*/
proc means data =my_data;
    var points;
run ; 

описательная статистика в SAS с использованием PROC MEANS

По умолчанию PROC MEANS вычисляет следующую описательную статистику:

  • N : Общее количество наблюдений
  • Среднее : среднее значение баллов.
  • Std Dev: стандартное отклонение точек.
  • Минимум : минимальное значение баллов.
  • Максимум : максимальное значение баллов.

Обратите внимание, что IQR не включается в выходные данные.

Мы можем использовать следующий синтаксис, чтобы включить IQR в выходные данные:

 /*calculate summary statistics for points and include IQR*/
proc means data =my_data N Mean QRANGE Std Min Max ;
    var points;
run ; 

Обратите внимание, что выходные данные теперь включают значение межквартильного диапазона для переменной точек .

Мы видим, что IQR для переменной Points оказывается равным 13 .

Помните, что IQR представляет собой разницу между 75-м и 25-м процентилем для данной переменной.

Если вы хотите увидеть значения этих процентилей, вы можете включить P25 и P75 в процедуру PROC MEANS :

 /*calculate summary statistics for points and include IQR*/
proc means data =my_data N Mean P25 P75 QRANGE Std Min Max ;
    var points;
run ; 

Теперь выходные данные включают 25-й процентиль, 75-й процентиль и межквартильный диапазон для переменной «баллы» .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как рассчитать описательную статистику в SAS
Как создать таблицы частот в SAS
Как рассчитать процентили в SAS
Как создавать сводные таблицы в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *