Як обчислити асиметрію та ексцес у sas


У статистиці асиметрія та ексцес є двома способами вимірювання форми розподілу.

Асиметрія вимірює асиметрію розподілу.

  • Від’ємна асимметрия вказує на те, що хвіст знаходиться зліва від розподілу.
  • Позитивний перекіс вказує на те, що хвіст знаходиться з правого боку розподілу.
  • Значення нуль вказує на те, що в розподілі немає асиметрії, що означає, що розподіл є абсолютно симетричним.

Ексцес визначає, чи є розподіл важким чи легким хвостом порівняно з нормальним розподілом .

  • Ексцес нормального розподілу дорівнює 0.
  • Якщо заданий розподіл має ексцес менший за 0, його називають динамічним , що означає, що він має тенденцію створювати менше екстремальних викидів, ніж нормальний розподіл.
  • Якщо заданий розподіл має ексцес більше 0, його називають лептокуртичним , тобто він має тенденцію створювати більше викидів, ніж нормальний розподіл.

Для обчислення асиметрії та ексцесу змінних у SAS можна використовувати оператори SKEWNESS і KURTOSIS у PROC MEANS .

У наступному прикладі показано, як використовувати ці інструкції на практиці.

Приклад: обчислення асиметрії та ексцесу в SAS

Припустімо, що в SAS є такий набір даних, який містить інформацію про різних баскетболістів:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Ми можемо використовувати PROC MEANS із операторами SKEWNESS і KURTOSIS , щоб обчислити асимметрию та ексцес кожної числової змінної в наборі даних:

 /*calculate skewness and kurtosis for each numeric variable*/
proc means data =my_data SKEWNESS KURTOSIS ;
run ; 

Вихідна таблиця відображає значення асиметрії та ексцесу для кожної числової змінної в наборі даних:

(1) бали

  • Змінна балів має асиметрію 1,009 . Оскільки це значення більше 0, це означає, що хвіст знаходиться з правого боку розподілу.
  • Змінна балів має ексцес -0,299 . Оскільки це значення менше 0, це означає, що розподіл має трохи менше викидів і менш екстремальні значення, ніж нормальний розподіл.

(2) допомога

  • Змінна результативної передачі має асиметрію 0,304 . Оскільки це значення більше 0, це означає, що хвіст знаходиться з правого боку розподілу.
  • Змінна підтримки має ексцес -0,782 . Оскільки це значення менше 0, це означає, що розподіл має менше викидів і менш екстремальних значень, ніж нормальний розподіл.

Щоб візуалізувати розподіл значень для кожної числової змінної в наборі даних, ви можете використовувати PROC UNIVARIATE для створення гістограм для точкових і допоміжних змінних:

 /*create histograms for points and assists variables*/
proc univariate data =my_data;
    var points assists;
    histogram points assists;
run ;

Це створює таку гістограму для змінної точок :

І наступна гістограма для змінної допомоги :

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як розрахувати описову статистику в SAS
Як створити частотні таблиці в SAS
Як розрахувати процентиль у SAS
Як створити зведені таблиці в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *