Як розрахувати описову статистику в sas


Описова статистика – це значення, які описують набір даних.

Вони допомагають нам зрозуміти, де знаходиться центр набору даних, а також розподіл значень у наборі даних.

Існує два поширених способи обчислення описової статистики для змінних у SAS:

1. Використовуйте PROC MEANS для обчислення підсумкової статистики

2. Використовуйте PROC UNIVARIATE для обчислення детальної описової статистики

У наведених нижче прикладах показано, як використовувати кожен метод на практиці з таким набором даних у SAS:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Приклад 1. Використовуйте PROC MEANS для обчислення підсумкової статистики

Наступний код показує, як використовувати PROC MEANS для обчислення підсумкової статистики для змінної точок у наборі даних:

 /*calculate summary statistics for points variable*/
proc means data =my_data;
    var points;
run ; 

описова статистика в SAS за допомогою PROC MEANS

Процедура PROC MEANS обчислює таку описову статистику:

  • N : Загальна кількість спостережень
  • Середнє : середнє значення балів
  • Std Dev: стандартне відхилення точок
  • Мінімум : мінімальне значення балів
  • Максимум : максимальне значення балів

Також зауважте, що ви можете використовувати оператор класу для обчислення описової статистики для однієї змінної, згрупованої за іншою змінною.

Наприклад, ми можемо використати наступний код для обчислення підсумкової статистики для змінної балів , згрупованої за змінною team :

 /*calculate summary statistics for points, grouped by team*/
proc means data =my_data;
    classteam ;
    var points;
run ; 

На виході відображається підсумкова статистика для змінної балів , згрупована за кожним унікальним значенням команди .

Приклад 2. Використовуйте PROC UNIVARIATE для обчислення детальної описової статистики

Наступний код показує, як використовувати PROC UNIVARIATE для обчислення детальної описової статистики для змінної Points :

 /*calculate detailed descriptive statistics for points variable*/
proc univariate data =my_data;
    var points;
run ; 

Процедура PROC UNIVARIATE обчислює детальну описову статистику для точкової змінної, включаючи середнє значення, медіану, моду, стандартне відхилення, дисперсію, діапазон, інтерквартильний діапазон тощо.

Ми також можемо використати оператор класу для обчислення цієї детальної описової статистики для змінної балів , згрупованої за змінною команди :

 /*calculate detailed descriptive statistics for points, grouped by team*/
proc univariate data =my_data;
    classteam ;
    var points;
run ;

Це створить три групи вихідних таблиць, які відображатимуть детальну описову статистику для змінної балів , згруповану за кожним унікальним значенням команди .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як створити частотні таблиці в SAS
Як розрахувати процентиль у SAS
Як створити зведені таблиці в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *