R에서 왜도와 첨도를 계산하는 방법


통계에서 왜도와 첨도는 분포의 모양을 측정하는 두 가지 방법입니다.

왜도는 분포의 왜도를 측정한 것입니다. 이 값은 양수 또는 음수일 수 있습니다.

  • 음의 왜도는 꼬리가 분포의 왼쪽에 있고 더 음의 값 쪽으로 확장된다는 것을 나타냅니다.
  • 양의 치우침은 꼬리가 분포의 오른쪽에 있고 더 양의 값 쪽으로 확장된다는 것을 나타냅니다.
  • 값이 0이면 분포에 비대칭성이 없음을 나타냅니다. 이는 분포가 완벽하게 대칭임을 의미합니다.

첨도는 정규 분포 와 비교하여 분포가 두꺼운 꼬리인지 얇은 꼬리인지를 측정한 것입니다.

  • 정규분포의 첨도는 3입니다.
  • 주어진 분포의 첨도가 3보다 작은 경우 플레이커틱(playkurtic) 이라고 하며, 이는 정규 분포보다 더 적은 수의 극단적인 이상값을 생성하는 경향이 있음을 의미합니다.
  • 특정 분포의 첨도가 3보다 큰 경우 이를 leptokurtic 이라고 합니다. 이는 정규 분포보다 더 많은 이상값을 생성하는 경향이 있음을 의미합니다.

참고: 일부 공식(Fisher 정의)에서는 정규 분포와 더 쉽게 비교할 수 있도록 첨도에서 3을 뺍니다. 이 정의를 사용하면 분포의 첨도 값이 0보다 큰 경우 정규 분포보다 첨도가 더 커집니다.

이 튜토리얼에서는 R에서 주어진 데이터 세트의 왜도와 첨도를 계산하는 방법을 설명합니다.

예: R의 왜도 및 편평화

다음과 같은 데이터 세트가 있다고 가정합니다.

 data = c(88, 95, 92, 97, 96, 97, 94, 86, 91, 95, 97, 88, 85, 76, 68)

히스토그램을 생성하여 이 데이터 세트의 값 분포를 빠르게 시각화할 수 있습니다.

 hist(data, col=' steelblue ') 

R의 왜도와 첨도

히스토그램을 보면 분포가 왼쪽으로 치우쳐 있는 것처럼 보입니다. 즉, 값의 대부분이 분포의 오른쪽에 집중되어 있습니다.

이 데이터세트의 왜도와 첨도를 계산하려면 R의 모멘트 라이브러리에 있는 Skewness()kurtosis() 함수를 사용할 수 있습니다.

 library (moments)

#calculate skewness
skewness(data)

[1] -1.391777

#calculate kurtosis
kurtosis(data)

[1] 4.177865

왜도는 -1.391777 이고 첨도는 4.177865 입니다.

왜도가 음수이므로 이는 분포가 왼쪽으로 치우쳐 있음을 나타냅니다. 이는 히스토그램에서 본 내용을 확인시켜줍니다.

첨도가 3보다 크므로 이는 정규 분포에 비해 분포의 꼬리에 더 많은 값이 있음을 나타냅니다.

또한 순간 라이브러리는 표본 데이터가 정규 분포와 일치하는 왜도 및 첨도를 나타내는지 여부를 결정하는 적합도 테스트를 수행하는 jarque.test() 함수를 제공합니다. 이 검정의 귀무가설과 대립가설은 다음과 같습니다.

귀무 가설 : 데이터 세트에는 정규 분포에 해당하는 왜도와 첨도가 있습니다.

대립 가설 : 데이터 세트에는 정규 분포에 해당하지 않는 편향과 첨도가 있습니다.

다음 코드는 이 테스트를 수행하는 방법을 보여줍니다.

 jarque.test(data)

	Jarque-Bera Normality Test

data:data
JB = 5.7097, p-value = 0.05756
alternative hypothesis: greater

테스트의 p-값은 0.05756 으로 나타났습니다. 이 값은 α = 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이 데이터 세트에 정규 분포와 다른 왜도와 첨도가 있다고 말할 수 있는 충분한 증거가 없습니다.

여기에서 전체 Moments 라이브러리 문서를 찾을 수 있습니다.

보너스: 왜도 및 첨도 계산기

주어진 데이터세트에 대한 왜도와 첨도를 자동으로 계산 하는 통계적 왜도 및 첨도 계산기를 사용하여 주어진 데이터세트에 대한 왜도를 계산할 수도 있습니다 .

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다