통계의 비대칭성을 해석하는 방법: 예 포함


통계에서는 왜도를 사용하여 분포의 대칭성을 설명합니다.

분포의 왼쪽에 “꼬리”가 있는 경우 데이터 값의 분포가 편향되었다고 말합니다.

왼쪽으로 치우친 분포

분포의 오른쪽에 “꼬리”가 있으면 분포 가 오른쪽으로 치우쳐 있다고 합니다.

오른쪽으로 치우친 분포

그리고 분포가 양쪽에서 대칭이면 비대칭이 없다고 말합니다.

편견 없는 배포

비대칭을 해석하는 방법

비대칭 값의 범위는 음의 무한대에서 양의 무한대까지입니다.

비대칭 값을 해석하는 방법은 다음과 같습니다.

  • 왜도의 음수 값은 꼬리가 분포의 왼쪽에 있고 더 음수 값 쪽으로 확장된다는 것을 나타냅니다.
  • 왜도의 양수 값은 꼬리가 분포의 오른쪽에 있고 더 양수 값 쪽으로 확장된다는 것을 나타냅니다.
  • 값이 0이면 분포에 비대칭성이 없음을 나타냅니다. 이는 분포가 완벽하게 대칭임을 의미합니다.

다음 예는 실제로 비대칭 값을 해석하는 방법을 보여줍니다.

예 1: 왼쪽으로 치우친 분포

대부분의 인구에서 사망자의 연령 분포는 왼쪽으로 치우쳐 있습니다. 대부분의 사람들은 70세에서 80세 사이에 살고 있으며, 이 연령 이하로 사는 사람은 점점 더 적어지고 있습니다.

사망 연령에 대한 값 분포를 시각화하기 위해 밀도 플롯을 만든 경우 다음과 같을 수 있습니다.

왼쪽으로 치우친 분포의 예

이 분포의 왜곡도를 계산하여 -1.3225 라고 가정합니다.

이 값은 음수이므로 분포가 왼쪽으로 치우쳐 있다는 의미로 해석됩니다. 즉, 꼬리가 분포의 왼쪽으로 확장된다는 의미입니다.

예 2: 오른쪽으로 치우친 분포

미국의 가계 소득 분포는 오른쪽으로 치우쳐 있으며, 대부분의 가구는 연간 $30,000에서 $70,000 사이를 벌지만 훨씬 더 많은 돈을 버는 오른쪽 꼬리가 길다.

가계 소득 가치의 분포를 시각화하기 위해 밀도 도표를 생성하면 다음과 같이 보일 수 있습니다.

오른쪽으로 치우친 분포의 예

이 분포의 왜도를 계산하여 2.0043 이라는 것을 알아냈다고 가정해 보겠습니다.

이 값은 양수이므로 분포가 오른쪽으로 치우쳐 있다는 의미로 해석됩니다. 즉 꼬리가 분포의 오른쪽으로 확장된다는 의미입니다.

예시 3: 편향 없음

수컷의 크기는 대략 정규 분포를 따르며 비대칭이 없습니다. 예를 들어, 미국 남성의 평균 키는 약 69.1인치입니다. 높이 분포는 대략 대칭적이며 일부는 더 짧고 다른 일부는 더 높습니다.

미국의 남성 키 분포를 시각화하기 위해 밀도 차트를 만들었다면 다음과 같을 것입니다.

편견 없는 분포의 예

이 분포의 왜도를 계산하여 0.0013 이라는 것을 알아냈다고 가정해 보겠습니다.

이 값은 0에 가까우므로 분포에 사실상 치우침이 없다는 의미로 해석합니다. 즉 분포 양쪽의 꼬리가 대략 동일하다는 의미입니다.

추가 리소스

다음 튜토리얼에서는 통계 왜곡에 대한 추가 정보를 제공합니다.

양으로 편향된 분포의 5가지 예
음으로 편향된 분포의 5가지 예
Excel에서 왜도를 계산하는 방법
상자 그림에서 비대칭성을 식별하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다