Як обчислити асиметрію та ексцес у sas
У статистиці асиметрія та ексцес є двома способами вимірювання форми розподілу.
Асиметрія вимірює асиметрію розподілу.
- Від’ємна асимметрия вказує на те, що хвіст знаходиться зліва від розподілу.
- Позитивний перекіс вказує на те, що хвіст знаходиться з правого боку розподілу.
- Значення нуль вказує на те, що в розподілі немає асиметрії, що означає, що розподіл є абсолютно симетричним.
Ексцес визначає, чи є розподіл важким чи легким хвостом порівняно з нормальним розподілом .
- Ексцес нормального розподілу дорівнює 0.
- Якщо заданий розподіл має ексцес менший за 0, його називають динамічним , що означає, що він має тенденцію створювати менше екстремальних викидів, ніж нормальний розподіл.
- Якщо заданий розподіл має ексцес більше 0, його називають лептокуртичним , тобто він має тенденцію створювати більше викидів, ніж нормальний розподіл.
Для обчислення асиметрії та ексцесу змінних у SAS можна використовувати оператори SKEWNESS і KURTOSIS у PROC MEANS .
У наступному прикладі показано, як використовувати ці інструкції на практиці.
Приклад: обчислення асиметрії та ексцесу в SAS
Припустімо, що в SAS є такий набір даних, який містить інформацію про різних баскетболістів:
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
Ми можемо використовувати PROC MEANS із операторами SKEWNESS і KURTOSIS , щоб обчислити асимметрию та ексцес кожної числової змінної в наборі даних:
/*calculate skewness and kurtosis for each numeric variable*/ proc means data =my_data SKEWNESS KURTOSIS ; run ;
Вихідна таблиця відображає значення асиметрії та ексцесу для кожної числової змінної в наборі даних:
(1) бали
- Змінна балів має асиметрію 1,009 . Оскільки це значення більше 0, це означає, що хвіст знаходиться з правого боку розподілу.
- Змінна балів має ексцес -0,299 . Оскільки це значення менше 0, це означає, що розподіл має трохи менше викидів і менш екстремальні значення, ніж нормальний розподіл.
(2) допомога
- Змінна результативної передачі має асиметрію 0,304 . Оскільки це значення більше 0, це означає, що хвіст знаходиться з правого боку розподілу.
- Змінна підтримки має ексцес -0,782 . Оскільки це значення менше 0, це означає, що розподіл має менше викидів і менш екстремальних значень, ніж нормальний розподіл.
Щоб візуалізувати розподіл значень для кожної числової змінної в наборі даних, ви можете використовувати PROC UNIVARIATE для створення гістограм для точкових і допоміжних змінних:
/*create histograms for points and assists variables*/
proc univariate data =my_data;
var points assists;
histogram points assists;
run ;
Це створює таку гістограму для змінної точок :
І наступна гістограма для змінної допомоги :
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як розрахувати описову статистику в SAS
Як створити частотні таблиці в SAS
Як розрахувати процентиль у SAS
Як створити зведені таблиці в SAS