Python에서 왜도와 첨도를 계산하는 방법
통계에서 왜도와 첨도는 분포의 모양을 측정하는 두 가지 방법입니다.
왜도는 분포의 왜도를 측정한 것입니다. 이 값은 양수 또는 음수일 수 있습니다.
- 음의 왜도는 꼬리가 분포의 왼쪽에 있고 더 음의 값 쪽으로 확장된다는 것을 나타냅니다.
- 양의 치우침은 꼬리가 분포의 오른쪽에 있고 더 양의 값 쪽으로 확장된다는 것을 나타냅니다.
- 값이 0이면 분포에 비대칭성이 없음을 나타냅니다. 이는 분포가 완벽하게 대칭임을 의미합니다.
첨도는 정규 분포 와 비교하여 분포가 두꺼운 꼬리인지 얇은 꼬리인지를 측정한 것입니다.
- 정규분포의 첨도는 3입니다.
- 주어진 분포의 첨도가 3보다 작은 경우 플레이커틱(playkurtic) 이라고 하며, 이는 정규 분포보다 더 적은 수의 극단적인 이상값을 생성하는 경향이 있음을 의미합니다.
- 특정 분포의 첨도가 3보다 큰 경우 이를 leptokurtic 이라고 합니다. 이는 정규 분포보다 더 많은 이상값을 생성하는 경향이 있음을 의미합니다.
참고: 일부 공식(Fisher 정의)에서는 정규 분포와 더 쉽게 비교할 수 있도록 첨도에서 3을 뺍니다. 이 정의를 사용하면 분포의 첨도 값이 0보다 큰 경우 정규 분포보다 첨도가 더 커집니다.
이 튜토리얼에서는 Python에서 주어진 데이터 세트의 왜도와 첨도를 계산하는 방법을 설명합니다.
예: Python의 왜곡 및 편평화
다음과 같은 데이터 세트가 있다고 가정합니다.
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
이 데이터세트의 샘플 왜도와 첨도를 계산하려면 Scipy Stata 라이브러리의 skew() 및 kurt() 함수를 다음 구문과 함께 사용할 수 있습니다.
- 편향(값 배열, 편향 = false)
- 커트(값 배열, 편향 = false)
모집단 왜도 및 첨도와 반대로 표본 왜도 및 첨도를 계산하려면 bias=False 인수를 사용합니다.
특정 데이터세트에 이러한 함수를 사용하는 방법은 다음과 같습니다.
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
왜도는 0.032697 이고 첨도는 0.118157 입니다.
이는 분포가 약간 긍정적으로 치우쳐 있으며 정규 분포에 비해 꼬리에 더 많은 값이 있음을 의미합니다.
추가 자료: 왜도 및 첨도 계산기
주어진 데이터세트에 대한 왜도와 첨도를 자동으로 계산 하는 통계적 왜도 및 첨도 계산기를 사용하여 주어진 데이터세트에 대한 왜도를 계산할 수도 있습니다 .