이봉 분포란 무엇입니까?


이봉 분포는 두 가지 모드를 갖는 확률 분포입니다.

기술 통계 에서는 데이터 집합에서 가장 일반적인 값을 나타내기 위해 “모드”라는 용어를 자주 사용하지만, 이 경우 “모드”라는 용어는 그래프의 로컬 최대값을 나타냅니다.

이봉 분포를 보면 이러한 두 가지 모드를 나타내는 두 개의 별개의 “피크”를 볼 수 있습니다.

바이모달 분포

이는 피크가 하나만 있는 단봉 분포와 다릅니다.

단봉 분포

다음을 기억하면 둘 사이의 차이점을 기억할 수 있습니다.

  • “비” = 2
  • ‘하나된’ = 하나

대부분의 통계 강좌에서는 다양한 주제를 설명하기 위해 정규 분포 와 같은 단봉 분포를 사용하지만 실제로는 쌍봉 분포가 자주 나타나므로 이를 인식하고 해석하는 방법을 알아두면 유용합니다.

참고: 이봉 분포는 다중 모드 분포 의 특정 유형입니다.

이봉 분포의 예

다음은 이봉 분포의 몇 가지 예입니다.

예 #1: 레스토랑 피크 시간

특정 레스토랑의 시간별 고객 분포를 시각화하기 위해 그래프를 만든 경우 점심 시간에 피크가 발생하고 저녁 시간에 또 다른 피크가 발생하는 이봉 분포를 따른다는 것을 알 수 있습니다.

이봉 분포의 예

예 번호 2: 두 식물종의 평균 키

당신이 들판을 돌아다니며 다양한 식물의 높이를 측정한다고 가정해 보십시오. 당신은 자신도 모르게 두 가지 다른 종의 크기를 측정하고 있습니다. 하나는 꽤 크고 다른 하나는 아주 작습니다. 높이 분포를 시각화하기 위해 그래프를 만든 경우 이봉 분포를 따릅니다.

이봉 분포의 예

예시 #3: 시험 결과

교사가 학생들에게 시험을 친다고 가정해 보겠습니다. 일부 학생들은 시험을 위해 공부했지만 다른 학생들은 그렇지 않았습니다. 교사가 시험 결과 그래프를 생성할 때, 공부하지 않은 학생의 낮은 점수 주변에 최고점이 있고 공부한 학생의 높은 점수 주변에 또 다른 최고점이 있는 이봉 분포를 따릅니다.

테스트 결과가 포함된 이봉 분포의 예

이중 모드 분포의 원인은 무엇입니까?

일반적으로 이봉 분포를 일으키는 두 가지 요인이 있습니다.

1. 몇 가지 근본적인 현상.

이봉 분포는 특정 기본 현상으로 인해 종종 발생합니다.

예를 들어, 매시간 레스토랑을 방문하는 고객 수는 사람들이 점심과 저녁이라는 서로 다른 두 시간에 레스토랑에서 식사하는 경향이 있기 때문에 이봉 분포를 따릅니다. 이러한 근본적인 인간 행동은 이봉 분포의 기원입니다.

2. 서로 다른 두 그룹이 함께 그룹화되었습니다.

Bimodal 분포는 두 개의 서로 다른 사물 그룹을 인식하지 못한 채 단순히 분석하는 경우에도 발생할 수 있습니다.

예를 들어, 두 가지 서로 다른 종이 같은 밭에서 자라고 있다는 사실을 깨닫지 못한 채 특정 밭에서 식물의 높이를 측정하는 경우 그래프를 만들 때 이봉 분포를 보게 됩니다.

이봉 분포를 분석하는 방법

평균이나 중앙값을 사용하여 분포를 설명하는 경우가 많습니다. 분포의 “중심”이 어디에 있는지 알 수 있기 때문입니다.

불행하게도 평균과 중앙값은 이봉 분포에 대해 아는 데 유용하지 않습니다. 예를 들어, 위 예에서 학생들의 평균 시험 점수는 81입니다.

그러나 81점에 가까운 점수를 받은 학생은 거의 없습니다. 이 경우 평균은 오해의 소지가 있습니다. 실제로 대부분의 학생들은 74~88점 정도를 받았습니다.

이봉 분포를 분석하고 해석하는 더 좋은 방법은 단순히 데이터를 두 개의 개별 그룹으로 나눈 다음 각 그룹의 중심과 분포를 분석하는 것입니다.

예를 들어, 시험 결과를 ‘낮은 점수’와 ‘높은 점수’로 나눈 다음 각 그룹의 평균과 표준편차를 찾을 수 있습니다.

분석 결과를 공유하고 데이터가 이봉 분포를 따르는 경우 위에 표시된 것과 같은 히스토그램을 생성하면 청중이 분포에 두 개의 뚜렷한 “피크”가 있고 오직 피크만 발생한다는 것을 청중이 명확하게 볼 수 있습니다. 하나의 대규모 데이터 세트가 아닌 각 피크를 개별적으로 분석하는 것이 좋습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다