오른쪽으로 치우친 히스토그램: 예 및 해석


히스토그램은 데이터 집합의 값 분포를 시각화할 수 있는 차트 유형입니다.

분포의 오른쪽에 “꼬리”가 있으면 히스토그램이 오른쪽으로 치우쳤다고 합니다.

오른쪽으로 치우친 히스토그램

참고 : 오른쪽으로 치우친 히스토그램을 양의 치우침 히스토그램 이라고도 합니다.

오른쪽으로 치우친 히스토그램에는 다음과 같은 두 가지 속성이 있습니다.

1. 분포의 상단이 왼쪽에 있습니다.

오른쪽으로 치우친 히스토그램의 피크

2. 평균이 중앙값보다 큽니다.

오른쪽으로 치우친 히스토그램의 평균 대 중앙값

히스토그램이 적절하게 치우쳐지는 이유는 무엇입니까?

가능한 최소값에는 제한이 있지만 가능한 최대값에는 제한이 없는 경우 히스토그램은 일반적으로 오른쪽으로 치우쳐 있습니다.

오른쪽으로 치우친 히스토그램의 가장 확실한 실제 사례는 국가의 소득 분포입니다.

개인이 벌 수 있는 최소 소득은 0달러이며, 개인이 벌 수 있는 최대 소득은 없습니다.

일반적으로 대부분의 개인은 연간 약 $40,000를 벌 수 있지만 연간 수백만 달러를 버는 몇 가지 예외가 있습니다.

소득 분포를 시각화하기 위해 히스토그램을 만들면 자연스럽게 왜곡됩니다.

오른쪽으로 치우친 히스토그램의 실제 예

오른쪽으로 치우친 히스토그램에서 평균이 중앙값보다 큰 이유는 무엇입니까?

오른쪽으로 치우친 히스토그램에서는 분포의 오른쪽 “꼬리”에 있는 높은 값이 평균 값을 크게 부풀리기 때문에 평균이 중앙값보다 큽니다.

간단한 예로, 10명의 소득이 포함된 다음 데이터세트가 있다고 가정해 보겠습니다.

데이터세트 1: $30,000, $35,000, $35,000, $40,000, $50,000, $55,000, $55,000, $70,000, $90,000, $110,000

이 데이터 세트의 평균 및 중앙값은 다음과 같습니다.

  • 평균 : $57,000
  • 중앙값 : $52.5,000

이제 마지막 값이 250만 달러라는 점을 제외하고는 완전히 동일한 소득을 포함하는 또 다른 데이터 세트가 있다고 가정합니다.

데이터 세트 2: $30,000, $35,000, $35,000, $40,000, $50,000, $55,000, $55,000, $70,000, $90,000, $250만

이 데이터 세트의 평균 및 중앙값은 다음과 같습니다.

  • 평균 : $296,000
  • 중앙값 : $52.5,000

후자의 이상치는 평균 소득의 상당한 증가로 이어집니다.

그리고 이 분포를 플로팅하면 히스토그램의 오른쪽 “꼬리”에 250만 달러의 가치가 있는 오른쪽으로 치우친 히스토그램이 됩니다.

오른쪽과 왼쪽으로 치우친 히스토그램의 차이

오른쪽으로 치우친 히스토그램의 반대는 왼쪽으로 치우친 히스토그램 입니다.

이것은 분포의 왼쪽에 “꼬리”가 있는 히스토그램 유형입니다.

이 유형의 히스토그램에는 다음과 같은 속성이 있습니다.

1. 분포의 정점은 오른쪽에 있습니다.

2. 평균이 중앙값보다 낮습니다.

이는 오른쪽으로 치우친 히스토그램의 정반대 속성입니다.

이 튜토리얼 에서 왼쪽으로 치우친 히스토그램에 대해 자세히 알아보세요.

추가 리소스

다음 자습서에서는 히스토그램에 대한 추가 정보를 제공합니다.

히스토그램의 평균과 중앙값을 추정하는 방법
히스토그램의 표준편차를 추정하는 방법
히스토그램의 모양을 설명하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다