상대도수분포란 무엇인가?


빈도 분포는 데이터 세트에 서로 다른 값이 나타나는 빈도를 나타냅니다.

예를 들어, 한 도시에서 400가구의 단순 무작위 표본을 수집하고 각 가구의 애완동물 수를 기록한다고 가정합니다. 다음 표는 결과를 보여줍니다.

이 표는 빈도 분포를 나타냅니다.

관련 분포를 상대 도수 분포 라고 하며, 이는 데이터 세트에 있는 각 값의 상대 도수를 모든 도수에 대한 백분율로 표시합니다.

예를 들어, 이전 표에서는 총 400가구가 있음을 확인했습니다. 분포에서 각 값의 상대 빈도를 찾으려면 각 개별 빈도를 400으로 나누면 됩니다.

상대도수분포

상대도수분포에는 다음과 같은 속성이 있습니다.

  • 각 개별 상대 빈도의 범위는 0%에서 100%입니다.
  • 모든 개별 상대도수의 합은 100%가 됩니다.

이러한 조건이 충족되지 않으면 상대도수분포가 유효하지 않습니다.

상대도수분포가 유용한 이유

상대도수분포는 다른 모든 값과 비교하여 데이터 세트에서 값이 얼마나 흔한지 이해할 수 있게 해주기 때문에 유용합니다.

이전 예에서는 150가구에 애완동물이 한 마리만 있는 것을 확인했습니다. 그러나 이 숫자 자체는 특별히 유용하지 않습니다.

대신, 표본의 전체 가구 중 37.5%가 애완동물을 한 마리만 키웠다는 사실을 아는 것이 더 유용합니다. 이는 3가구 중 1가구 이상이 애완동물을 한 마리만 키웠다는 사실을 이해하는 데 도움이 되며, 이는 애완동물 한 마리를 소유하는 것이 얼마나 “흔한” 일인지에 대한 아이디어를 제공합니다.

상대도수분포 시각화

상대도수 분포를 시각화하는 가장 일반적인 방법은 그래프의 x축을 따라 개별 데이터 값을 표시하고 y축을 따라 각 클래스의 상대도수를 막대를 사용하여 나타내는 상대도수 히스토그램을 만드는 것입니다.

예를 들어, 이전 예의 데이터에 대한 상대 빈도 히스토그램은 다음과 같습니다.

x축은 가구 내 애완동물의 수를 나타내고, y축은 해당 애완동물을 소유한 가구의 상대적 빈도를 표시합니다.

이 히스토그램은 상대 빈도 분포를 시각화하는 유용한 방법입니다.

추가 리소스

상대빈도 계산기
Excel에서 상대 빈도를 계산하는 방법
Python에서 상대 빈도를 계산하는 방법
R에서 상대 빈도 히스토그램을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다