Як обчислити асиметрію та ексцес у python


У статистиці асиметрія та ексцес є двома способами вимірювання форми розподілу.

Асиметрія – це міра асиметрії розподілу. Це значення може бути позитивним або негативним.

  • Від’ємна асиметрія вказує на те, що хвіст знаходиться на лівій стороні розподілу, який розширюється до більш негативних значень.
  • Позитивний перекіс вказує на те, що хвіст знаходиться на правій стороні розподілу, який розширюється до більш позитивних значень.
  • Значення нуль вказує на те, що в розподілі немає асиметрії, що означає, що розподіл є абсолютно симетричним.

Ексцес – це міра того, чи є розподіл важким чи легким хвостом порівняно з нормальним розподілом .

  • Ексцес нормального розподілу дорівнює 3.
  • Якщо певний розподіл має ексцес менший за 3, його називають динамічним , що означає, що він має тенденцію створювати менше екстремальних викидів, ніж нормальний розподіл.
  • Якщо заданий розподіл має ексцес більше 3, його називають лептокуртичним , тобто він має тенденцію створювати більше викидів, ніж нормальний розподіл.

Примітка. Деякі формули (визначення Фішера) віднімають 3 від ексцесу, щоб полегшити порівняння з нормальним розподілом. Використовуючи це визначення, розподіл матиме більший ексцес, ніж звичайний розподіл, якщо він матиме значення ексцесу більше 0.

У цьому підручнику пояснюється, як обчислити як асиметрію, так і ексцес даного набору даних у Python.

Приклад: перекоси та зведення в Python

Припустимо, ми маємо наступний набір даних:

 data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

Щоб обчислити вибіркову асимметрию та ексцес цього набору даних, ми можемо використати функції skew() і kurt() із бібліотеки Scipy Stata із таким синтаксисом:

  • зміщення (масив значень, зміщення = false)
  • kurt (масив значень, зміщення = false)

Ми використовуємо аргумент bias=False для обчислення асиметрії та ексцесу вибірки на відміну від асиметрії генеральної сукупності та ексцесу.

Ось як використовувати ці функції для нашого конкретного набору даних:

 data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

#calculate sample skewness
skew(data, bias= False )

0.032697

#calculate sample kurtosis
kurtosis(data, bias= False )

0.118157

Асиметрія виявляється 0,032697 , а ексцес виявляється 0,118157 .

Це означає, що розподіл має дещо позитивний перекіс і має більше значень у хвостах порівняно зі звичайним розподілом.

Додатковий ресурс: Калькулятор асиметрії та ексцесу

Ви також можете обчислити асиметрію для певного набору даних за допомогою статистичного калькулятора асиметрії та ексцесу , який автоматично обчислює асиметрію та ексцес для заданого набору даних.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *