Python에서 왜도와 첨도를 계산하는 방법


통계에서 왜도와 첨도는 분포의 모양을 측정하는 두 가지 방법입니다.

왜도는 분포의 왜도를 측정한 것입니다. 이 값은 양수 또는 음수일 수 있습니다.

  • 음의 왜도는 꼬리가 분포의 왼쪽에 있고 더 음의 값 쪽으로 확장된다는 것을 나타냅니다.
  • 양의 치우침은 꼬리가 분포의 오른쪽에 있고 더 양의 값 쪽으로 확장된다는 것을 나타냅니다.
  • 값이 0이면 분포에 비대칭성이 없음을 나타냅니다. 이는 분포가 완벽하게 대칭임을 의미합니다.

첨도는 정규 분포 와 비교하여 분포가 두꺼운 꼬리인지 얇은 꼬리인지를 측정한 것입니다.

  • 정규분포의 첨도는 3입니다.
  • 주어진 분포의 첨도가 3보다 작은 경우 플레이커틱(playkurtic) 이라고 하며, 이는 정규 분포보다 더 적은 수의 극단적인 이상값을 생성하는 경향이 있음을 의미합니다.
  • 특정 분포의 첨도가 3보다 큰 경우 이를 leptokurtic 이라고 합니다. 이는 정규 분포보다 더 많은 이상값을 생성하는 경향이 있음을 의미합니다.

참고: 일부 공식(Fisher 정의)에서는 정규 분포와 더 쉽게 비교할 수 있도록 첨도에서 3을 뺍니다. 이 정의를 사용하면 분포의 첨도 값이 0보다 큰 경우 정규 분포보다 첨도가 더 커집니다.

이 튜토리얼에서는 Python에서 주어진 데이터 세트의 왜도와 첨도를 계산하는 방법을 설명합니다.

예: Python의 왜곡 및 편평화

다음과 같은 데이터 세트가 있다고 가정합니다.

 data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

이 데이터세트의 샘플 왜도와 첨도를 계산하려면 Scipy Stata 라이브러리의 skew()kurt() 함수를 다음 구문과 함께 사용할 수 있습니다.

  • 편향(값 배열, 편향 = false)
  • 커트(값 배열, 편향 = false)

모집단 왜도 및 첨도와 반대로 표본 왜도 및 첨도를 계산하려면 bias=False 인수를 사용합니다.

특정 데이터세트에 이러한 함수를 사용하는 방법은 다음과 같습니다.

 data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

#calculate sample skewness
skew(data, bias= False )

0.032697

#calculate sample kurtosis
kurtosis(data, bias= False )

0.118157

왜도는 0.032697 이고 첨도는 0.118157 입니다.

이는 분포가 약간 긍정적으로 치우쳐 있으며 정규 분포에 비해 꼬리에 더 많은 값이 있음을 의미합니다.

추가 자료: 왜도 및 첨도 계산기

주어진 데이터세트에 대한 왜도와 첨도를 자동으로 계산 하는 통계적 왜도 및 첨도 계산기를 사용하여 주어진 데이터세트에 대한 왜도를 계산할 수도 있습니다 .

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다