Как рассчитать асимметрию и эксцесс в python
В статистике асимметрия и эксцесс — это два способа измерения формы распределения.
Асимметрия — это мера асимметрии распределения. Это значение может быть положительным или отрицательным.
- Отрицательная асимметрия указывает на то, что хвост находится на левой стороне распределения и простирается в сторону более отрицательных значений.
- Положительный перекос указывает на то, что хвост находится на правой стороне распределения и простирается в сторону более положительных значений.
- Нулевое значение указывает на отсутствие асимметрии в распределении, а это означает, что распределение совершенно симметрично.
Куртозис — это мера того, является ли распределение тяжелым или легким по сравнению с нормальным распределением .
- Эксцесс нормального распределения равен 3.
- Если данное распределение имеет эксцесс меньше 3, его называют плейкуртическим , что означает, что оно имеет тенденцию давать все меньше и меньше экстремальных выбросов, чем нормальное распределение.
- Если данное распределение имеет эксцесс больше 3, оно называется лептокуртическим , что означает, что оно имеет тенденцию давать больше выбросов, чем нормальное распределение.
Примечание. Некоторые формулы (определение Фишера) вычитают 3 из эксцесса, чтобы облегчить сравнение с нормальным распределением. Используя это определение, распределение будет иметь больший эксцесс, чем нормальное распределение, если его значение эксцесса больше 0.
В этом руководстве объясняется, как рассчитать асимметрию и эксцесс заданного набора данных в Python.
Пример: асимметрия и сглаживание в Python
Предположим, у нас есть следующий набор данных:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
Чтобы вычислить асимметрию выборки и эксцесс этого набора данных, мы можем использовать функции skew() и kurt() из библиотеки Scipy Stata со следующим синтаксисом:
- смещение (массив значений, смещение = ложь)
- Курт (массив значений, смещение = ложь)
Мы используем аргумент смещение = ложь для расчета асимметрии выборки и эксцесса, в отличие от асимметрии генеральной совокупности и эксцесса.
Вот как использовать эти функции для нашего конкретного набора данных:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
Асимметрия оказывается 0,032697 , а эксцесс — 0,118157 .
Это означает, что распределение слегка перекошено в положительную сторону и имеет больше значений в хвостах по сравнению с нормальным распределением.
Дополнительный ресурс: Калькулятор асимметрии и эксцесса
Вы также можете рассчитать асимметрию для данного набора данных с помощью калькулятора статистической асимметрии и эксцесса , который автоматически рассчитывает асимметрию и эксцесс для данного набора данных.