Как рассчитать асимметрию и эксцесс в python


В статистике асимметрия и эксцесс — это два способа измерения формы распределения.

Асимметрия — это мера асимметрии распределения. Это значение может быть положительным или отрицательным.

  • Отрицательная асимметрия указывает на то, что хвост находится на левой стороне распределения и простирается в сторону более отрицательных значений.
  • Положительный перекос указывает на то, что хвост находится на правой стороне распределения и простирается в сторону более положительных значений.
  • Нулевое значение указывает на отсутствие асимметрии в распределении, а это означает, что распределение совершенно симметрично.

Куртозис — это мера того, является ли распределение тяжелым или легким по сравнению с нормальным распределением .

  • Эксцесс нормального распределения равен 3.
  • Если данное распределение имеет эксцесс меньше 3, его называют плейкуртическим , что означает, что оно имеет тенденцию давать все меньше и меньше экстремальных выбросов, чем нормальное распределение.
  • Если данное распределение имеет эксцесс больше 3, оно называется лептокуртическим , что означает, что оно имеет тенденцию давать больше выбросов, чем нормальное распределение.

Примечание. Некоторые формулы (определение Фишера) вычитают 3 из эксцесса, чтобы облегчить сравнение с нормальным распределением. Используя это определение, распределение будет иметь больший эксцесс, чем нормальное распределение, если его значение эксцесса больше 0.

В этом руководстве объясняется, как рассчитать асимметрию и эксцесс заданного набора данных в Python.

Пример: асимметрия и сглаживание в Python

Предположим, у нас есть следующий набор данных:

 data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

Чтобы вычислить асимметрию выборки и эксцесс этого набора данных, мы можем использовать функции skew() и kurt() из библиотеки Scipy Stata со следующим синтаксисом:

  • смещение (массив значений, смещение = ложь)
  • Курт (массив значений, смещение = ложь)

Мы используем аргумент смещение = ложь для расчета асимметрии выборки и эксцесса, в отличие от асимметрии генеральной совокупности и эксцесса.

Вот как использовать эти функции для нашего конкретного набора данных:

 data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

#calculate sample skewness
skew(data, bias= False )

0.032697

#calculate sample kurtosis
kurtosis(data, bias= False )

0.118157

Асимметрия оказывается 0,032697 , а эксцесс — 0,118157 .

Это означает, что распределение слегка перекошено в положительную сторону и имеет больше значений в хвостах по сравнению с нормальным распределением.

Дополнительный ресурс: Калькулятор асимметрии и эксцесса

Вы также можете рассчитать асимметрию для данного набора данных с помощью калькулятора статистической асимметрии и эксцесса , который автоматически рассчитывает асимметрию и эксцесс для данного набора данных.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *