상자 그림에서 비대칭성을 식별하는 방법


상자 그림은 다음을 포함하는 데이터 세트의 5자리 요약을 표시하는 그림 유형입니다.

  • 최소값
  • 첫 번째 사분위수(25번째 백분위수)
  • 중앙값
  • 3분위수(75번째 백분위수)
  • 최대값

상자 그림을 그리려면 다음 프로세스를 사용합니다.

  • 첫 번째 사분위수(Q1)에서 세 번째 사분위수(Q3)까지 상자를 그립니다.
  • 그런 다음 상자 내부 중앙값에 선을 그립니다.
  • 그런 다음 사분위수의 “수염”을 최소값과 최대값으로 그립니다.

상자 그림에서 중앙값이 어디에 있는지에 따라 분포가 치우쳐 있는지 여부를 확인할 수 있습니다.

상자 그림의 비대칭성

중앙값이 상자 바닥에 더 가깝고 수염이 상자 하단에서 더 짧으면 분포는 오른쪽으로 치우쳐 있습니다(또는 “양으로” 치우쳐 있습니다).

중앙값이 상자 상단에 더 가깝고 수염이 상자 상단에서 더 짧으면 분포는 왼쪽으로 치우쳐 있습니다(또는 “음의” 치우침).

중앙값이 상자 중앙에 있고 수염이 양쪽에서 거의 같을 때 분포는 대칭입니다(또는 비대칭이 “아님”).

다음 예에서는 분포가 오른쪽으로 치우쳐 있는지, 왼쪽으로 치우쳐 있는지, 치우침이 없는지 확인하기 위해 상자 그림을 사용하는 방법을 보여줍니다.

예 1: 오른쪽으로 치우친 분포

미국의 연간 가계소득 분포는 오른쪽으로 치우쳐 있습니다. 대부분의 가구는 연간 $40,000에서 $80,000 사이를 벌지만 훨씬 더 많은 돈을 버는 가구를 나타내는 분포의 오른쪽 긴 꼬리가 있습니다.

가계 소득 분포를 시각화하기 위해 상자 그림을 만들면 다음과 같습니다.

중앙값을 나타내는 상자 내부의 수직선은 3분위수보다 1분위수에 훨씬 더 가깝습니다. 이는 분포가 오른쪽으로 치우쳐 있음을 의미합니다.

예 2: 왼쪽으로 치우친 분포

대부분의 인구에서 사망자의 연령 분포는 왼쪽으로 치우쳐 있습니다. 대부분의 사람들은 70세에서 80세 사이에 살고 있으며, 이 연령 이하로 사는 사람은 점점 더 적어지고 있습니다.

사망자의 연령 분포를 시각화하기 위해 상자 그림을 만든 경우 다음과 같습니다.

중앙값을 나타내는 상자 내부의 수직선은 첫 번째 사분위수보다 세 번째 사분위수에 훨씬 더 가깝습니다. 이는 분포가 왼쪽으로 치우쳐 있음을 의미합니다.

예시 3: 대칭 분포

수컷의 크기 분포는 거의 대칭 이며 비대칭이 없습니다. 예를 들어, 미국 남성의 평균 키는 약 69.1인치입니다. 높이 분포는 대략 대칭적이며 일부는 더 짧고 다른 일부는 더 높습니다.

미국의 남성 키 분포를 시각화하기 위해 상자 그림을 만든 경우 다음과 같습니다.

중앙값을 나타내는 상자 내부의 수직선도 1분위수와 3분위수에 가깝습니다. 이는 분포가 대칭이고 왜곡이 없음을 의미합니다.

추가 리소스

왼쪽 또는 오른쪽으로 치우친 분포
상자 그림을 비교하는 방법: 예 포함
Excel에서 병렬 상자 그림을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다