상대도수분포란 무엇인가?
빈도 분포는 데이터 세트에 서로 다른 값이 나타나는 빈도를 나타냅니다.
예를 들어, 한 도시에서 400가구의 단순 무작위 표본을 수집하고 각 가구의 애완동물 수를 기록한다고 가정합니다. 다음 표는 결과를 보여줍니다.
이 표는 빈도 분포를 나타냅니다.
관련 분포를 상대 도수 분포 라고 하며, 이는 데이터 세트에 있는 각 값의 상대 도수를 모든 도수에 대한 백분율로 표시합니다.
예를 들어, 이전 표에서는 총 400가구가 있음을 확인했습니다. 분포에서 각 값의 상대 빈도를 찾으려면 각 개별 빈도를 400으로 나누면 됩니다.
상대도수분포에는 다음과 같은 속성이 있습니다.
- 각 개별 상대 빈도의 범위는 0%에서 100%입니다.
- 모든 개별 상대도수의 합은 100%가 됩니다.
이러한 조건이 충족되지 않으면 상대도수분포가 유효하지 않습니다.
상대도수분포가 유용한 이유
상대도수분포는 다른 모든 값과 비교하여 데이터 세트에서 값이 얼마나 흔한지 이해할 수 있게 해주기 때문에 유용합니다.
이전 예에서는 150가구에 애완동물이 한 마리만 있는 것을 확인했습니다. 그러나 이 숫자 자체는 특별히 유용하지 않습니다.
대신, 표본의 전체 가구 중 37.5%가 애완동물을 한 마리만 키웠다는 사실을 아는 것이 더 유용합니다. 이는 3가구 중 1가구 이상이 애완동물을 한 마리만 키웠다는 사실을 이해하는 데 도움이 되며, 이는 애완동물 한 마리를 소유하는 것이 얼마나 “흔한” 일인지에 대한 아이디어를 제공합니다.
상대도수분포 시각화
상대도수 분포를 시각화하는 가장 일반적인 방법은 그래프의 x축을 따라 개별 데이터 값을 표시하고 y축을 따라 각 클래스의 상대도수를 막대를 사용하여 나타내는 상대도수 히스토그램을 만드는 것입니다.
예를 들어, 이전 예의 데이터에 대한 상대 빈도 히스토그램은 다음과 같습니다.
x축은 가구 내 애완동물의 수를 나타내고, y축은 해당 애완동물을 소유한 가구의 상대적 빈도를 표시합니다.
이 히스토그램은 상대 빈도 분포를 시각화하는 유용한 방법입니다.
추가 리소스
상대빈도 계산기
Excel에서 상대 빈도를 계산하는 방법
Python에서 상대 빈도를 계산하는 방법
R에서 상대 빈도 히스토그램을 만드는 방법