Sas: як відобразити iqr у proc means


Ви можете використовувати PROC MEANS для обчислення підсумкової статистики для змінних у SAS.

За замовчуванням PROC MEANS не відображає інтерквартильний діапазон (IQR) як одну зі зведених статистичних даних, але ви можете використовувати оператор QRANGE , щоб включити IQR у вихідні дані:

 proc means data =my_data N Mean QRANGE Std Min Max ;
    var points;
run ;

У цьому прикладі обчислюється загальна кількість спостережень, середнє значення, інтерквартильний діапазон, стандартне відхилення, мінімальне та максимальне значення для змінної, яка називається балами .

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: Показати IQR у PROC ОЗНАЧАЄ в SAS

Припустімо, що в SAS є такий набір даних, який містить інформацію про різних баскетболістів:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Припустимо, ми використовуємо PROC MEANS для обчислення підсумкової статистики для змінної точок у наборі даних:

 /*calculate summary statistics for points variable*/
proc means data =my_data;
    var points;
run ; 

описова статистика в SAS за допомогою PROC MEANS

За замовчуванням PROC MEANS обчислює таку описову статистику:

  • N : Загальна кількість спостережень
  • Середнє : середнє значення балів
  • Std Dev: стандартне відхилення точок
  • Мінімум : мінімальне значення балів
  • Максимум : максимальне значення балів

Зауважте, що IQR не включено до вихідних даних.

Ми можемо використати такий синтаксис, щоб включити IQR у вихідні дані:

 /*calculate summary statistics for points and include IQR*/
proc means data =my_data N Mean QRANGE Std Min Max ;
    var points;
run ; 

Зверніть увагу, що вихідні дані тепер включають значення інтерквартильного діапазону для змінної балів .

Ми бачимо, що IQR для змінної балів виявляється рівним 13 .

Пам’ятайте, що IQR представляє різницю між 75-м процентилем і 25-м процентилем для даної змінної.

Якщо ви хочете побачити значення цих процентилів, ви можете включити P25 і P75 в процедуру PROC MEANS :

 /*calculate summary statistics for points and include IQR*/
proc means data =my_data N Mean P25 P75 QRANGE Std Min Max ;
    var points;
run ; 

Вихідні дані тепер включають 25-й процентиль, 75-й процентиль і інтерквартильний діапазон для змінної балів .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як розрахувати описову статистику в SAS
Як створити частотні таблиці в SAS
Як розрахувати процентиль у SAS
Як створити зведені таблиці в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *