Як обчислити асиметрію та ексцес у python
У статистиці асиметрія та ексцес є двома способами вимірювання форми розподілу.
Асиметрія – це міра асиметрії розподілу. Це значення може бути позитивним або негативним.
- Від’ємна асиметрія вказує на те, що хвіст знаходиться на лівій стороні розподілу, який розширюється до більш негативних значень.
- Позитивний перекіс вказує на те, що хвіст знаходиться на правій стороні розподілу, який розширюється до більш позитивних значень.
- Значення нуль вказує на те, що в розподілі немає асиметрії, що означає, що розподіл є абсолютно симетричним.
Ексцес – це міра того, чи є розподіл важким чи легким хвостом порівняно з нормальним розподілом .
- Ексцес нормального розподілу дорівнює 3.
- Якщо певний розподіл має ексцес менший за 3, його називають динамічним , що означає, що він має тенденцію створювати менше екстремальних викидів, ніж нормальний розподіл.
- Якщо заданий розподіл має ексцес більше 3, його називають лептокуртичним , тобто він має тенденцію створювати більше викидів, ніж нормальний розподіл.
Примітка. Деякі формули (визначення Фішера) віднімають 3 від ексцесу, щоб полегшити порівняння з нормальним розподілом. Використовуючи це визначення, розподіл матиме більший ексцес, ніж звичайний розподіл, якщо він матиме значення ексцесу більше 0.
У цьому підручнику пояснюється, як обчислити як асиметрію, так і ексцес даного набору даних у Python.
Приклад: перекоси та зведення в Python
Припустимо, ми маємо наступний набір даних:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
Щоб обчислити вибіркову асимметрию та ексцес цього набору даних, ми можемо використати функції skew() і kurt() із бібліотеки Scipy Stata із таким синтаксисом:
- зміщення (масив значень, зміщення = false)
- kurt (масив значень, зміщення = false)
Ми використовуємо аргумент bias=False для обчислення асиметрії та ексцесу вибірки на відміну від асиметрії генеральної сукупності та ексцесу.
Ось як використовувати ці функції для нашого конкретного набору даних:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
Асиметрія виявляється 0,032697 , а ексцес виявляється 0,118157 .
Це означає, що розподіл має дещо позитивний перекіс і має більше значень у хвостах порівняно зі звичайним розподілом.
Додатковий ресурс: Калькулятор асиметрії та ексцесу
Ви також можете обчислити асиметрію для певного набору даних за допомогою статистичного калькулятора асиметрії та ексцесу , який автоматично обчислює асиметрію та ексцес для заданого набору даних.