다중 모드 분포란 무엇입니까?


다중 모드 분포는 두 개 이상의 모드를 갖는 확률 분포입니다.

다중 모드 분포를 시각화하기 위해 히스토그램을 생성하면 여러 개의 피크가 있음을 알 수 있습니다.

다중 모드 배포

분포에 정확히 두 개의 피크가 있는 경우 다중 모드 분포의 특정 유형인이봉 분포 로 간주됩니다.

이는 피크가 하나만 있는 단봉 분포와 대조됩니다.

통계학에서는 정규분포 와 같은 단봉분포가 가장 많이 사용되지만, 실제로는 다봉분포가 자주 등장하므로 이를 인식하고 분석하는 방법을 알아두면 유용하다.

다중 모드 분포의 예

다음은 다중 모드 분포의 몇 가지 예입니다.

예시 1: 시험 결과 배포

교수가 수업 시간에 시험을 쳤다고 가정해 보겠습니다. 어떤 학생들은 공부했고, 어떤 학생들은 공부하지 않았습니다. 교수가 시험 점수의 히스토그램을 생성할 때, 공부하지 않은 학생의 낮은 점수 주변에 최고점이 있고 공부한 학생의 높은 점수 주변에 또 다른 최고점이 있는 다중 모드 분포를 따릅니다.

다중 모드 분포의 예

예시 2: 다양한 식물 종의 높이

과학자가 들판을 돌아다니며 다양한 식물의 높이를 측정한다고 가정해 보겠습니다. 그녀는 자신도 모르게 세 가지 다른 종의 크기를 측정합니다. 하나는 아주 크고, 다른 하나는 중간 크기이고, 다른 하나는 아주 작습니다.

높이 분포를 시각화하기 위해 히스토그램을 만들 때 그녀는 그것이 다중 모드라는 것을 발견했습니다. 각 피크는 세 가지 다른 종의 가장 일반적인 높이를 나타냅니다.

다중 모드 분포의 예

예시 3: 고객 분포

레스토랑 주인은 매시간 방문하는 고객 수를 추적합니다. 고객 분포를 시각화하기 위해 히스토그램을 만들 때 그는 분포가 다중 모드임을 확인합니다. 점심 시간에 피크가 있고 저녁 시간에 또 다른 피크가 있습니다.

다중 모드 분포의 원인은 무엇입니까?

일반적으로 다중 모드 분포의 기본 원인은 두 가지 중 하나입니다.

1. 여러 그룹이 함께 그룹화됩니다.

다중 모드 분포는 인식하지 못한 채 여러 그룹에 대한 데이터를 수집할 때 발생할 수 있습니다.

예를 들어, 과학자가 동일한 밭에 있는 서로 다른 세 가지 식물 종의 높이를 무의식적으로 측정하는 경우 동일한 히스토그램에 배치하면 모든 식물의 분포가 다중 모드로 나타납니다.

2. 근본적인 현상이 있습니다.

특정 기본 현상으로 인해 다중 모드 분포가 발생할 수도 있습니다.

예를 들어, 매시간 레스토랑을 방문하는 고객 수는 사람들이 점심과 저녁이라는 서로 다른 두 시간에 레스토랑에서 식사하는 경향이 있기 때문에 다중 모드 분포를 따릅니다. 이러한 근본적인 인간 행동은 다중 모드 배포의 기원입니다.

다중 모드 분포를 분석하는 방법

평균이나 중앙값을 사용하여 분포를 설명하는 경우가 많습니다. 분포의 “중심”이 어디에 있는지 알 수 있기 때문입니다.

불행하게도 평균과 중앙값은 이봉 분포에 대해 아는 데 유용하지 않습니다. 예를 들어, 위 예에서 학생들의 평균 시험 점수는 81입니다.

그러나 81점에 가까운 점수를 받은 학생은 거의 없습니다. 이 경우 평균은 오해의 소지가 있습니다. 실제로 대부분의 학생들은 74~88점 정도를 받았습니다.

이봉 분포를 분석하고 해석하는 더 좋은 방법은 단순히 데이터를 두 개의 개별 그룹으로 나눈 다음 각 그룹의 중심 위치와 분포를 개별적으로 분석하는 것입니다.

예를 들어, 시험 결과를 ‘낮은 점수’와 ‘높은 점수’로 나눈 다음 각 그룹의 평균과 표준편차를 찾을 수 있습니다.

평균, 중앙값, 표준편차 등 특정 분포에 대한 요약 통계를 계산할 때 분포를 시각화하여 단봉형인지 다중봉형인지 확인해야 합니다.

분포가 다중 모드인 경우 단일 평균, 중앙값 또는 표준 편차를 사용하여 설명하는 것은 오해의 소지가 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다