통계의 비대칭성을 해석하는 방법: 예 포함
통계에서는 왜도를 사용하여 분포의 대칭성을 설명합니다.
분포의 왼쪽에 “꼬리”가 있는 경우 데이터 값의 분포가 편향되었다고 말합니다.
분포의 오른쪽에 “꼬리”가 있으면 분포 가 오른쪽으로 치우쳐 있다고 합니다.
그리고 분포가 양쪽에서 대칭이면 비대칭이 없다고 말합니다.
비대칭을 해석하는 방법
비대칭 값의 범위는 음의 무한대에서 양의 무한대까지입니다.
비대칭 값을 해석하는 방법은 다음과 같습니다.
- 왜도의 음수 값은 꼬리가 분포의 왼쪽에 있고 더 음수 값 쪽으로 확장된다는 것을 나타냅니다.
- 왜도의 양수 값은 꼬리가 분포의 오른쪽에 있고 더 양수 값 쪽으로 확장된다는 것을 나타냅니다.
- 값이 0이면 분포에 비대칭성이 없음을 나타냅니다. 이는 분포가 완벽하게 대칭임을 의미합니다.
다음 예는 실제로 비대칭 값을 해석하는 방법을 보여줍니다.
예 1: 왼쪽으로 치우친 분포
대부분의 인구에서 사망자의 연령 분포는 왼쪽으로 치우쳐 있습니다. 대부분의 사람들은 70세에서 80세 사이에 살고 있으며, 이 연령 이하로 사는 사람은 점점 더 적어지고 있습니다.
사망 연령에 대한 값 분포를 시각화하기 위해 밀도 플롯을 만든 경우 다음과 같을 수 있습니다.
이 분포의 왜곡도를 계산하여 -1.3225 라고 가정합니다.
이 값은 음수이므로 분포가 왼쪽으로 치우쳐 있다는 의미로 해석됩니다. 즉, 꼬리가 분포의 왼쪽으로 확장된다는 의미입니다.
예 2: 오른쪽으로 치우친 분포
미국의 가계 소득 분포는 오른쪽으로 치우쳐 있으며, 대부분의 가구는 연간 $30,000에서 $70,000 사이를 벌지만 훨씬 더 많은 돈을 버는 오른쪽 꼬리가 길다.
가계 소득 가치의 분포를 시각화하기 위해 밀도 도표를 생성하면 다음과 같이 보일 수 있습니다.
이 분포의 왜도를 계산하여 2.0043 이라는 것을 알아냈다고 가정해 보겠습니다.
이 값은 양수이므로 분포가 오른쪽으로 치우쳐 있다는 의미로 해석됩니다. 즉 꼬리가 분포의 오른쪽으로 확장된다는 의미입니다.
예시 3: 편향 없음
수컷의 크기는 대략 정규 분포를 따르며 비대칭이 없습니다. 예를 들어, 미국 남성의 평균 키는 약 69.1인치입니다. 높이 분포는 대략 대칭적이며 일부는 더 짧고 다른 일부는 더 높습니다.
미국의 남성 키 분포를 시각화하기 위해 밀도 차트를 만들었다면 다음과 같을 것입니다.
이 분포의 왜도를 계산하여 0.0013 이라는 것을 알아냈다고 가정해 보겠습니다.
이 값은 0에 가까우므로 분포에 사실상 치우침이 없다는 의미로 해석합니다. 즉 분포 양쪽의 꼬리가 대략 동일하다는 의미입니다.
추가 리소스
다음 튜토리얼에서는 통계 왜곡에 대한 추가 정보를 제공합니다.
양으로 편향된 분포의 5가지 예
음으로 편향된 분포의 5가지 예
Excel에서 왜도를 계산하는 방법
상자 그림에서 비대칭성을 식별하는 방법