그룹화되지 않은 빈도 분포: 정의 및 예


15개 가구에 집에 동물이 몇 마리 있는지 묻는 설문조사를 실시한다고 가정해 보겠습니다. 결과는 다음과 같습니다:

1장, 1장, 1장, 1장, 2장, 2장, 2장, 3장, 3장, 4장, 5장, 5장, 6장, 7장, 8장

이러한 결과를 요약하는 한 가지 방법은 데이터 세트에 서로 다른 값이 얼마나 자주 나타나는지 알려주는 빈도 분포를 만드는 것입니다.

우리는 종종 값 그룹을 생성한 다음 해당 그룹에 속하는 데이터 세트의 관측치 수를 요약하는 클러스터링된 빈도 분포를 사용합니다.

다음은 설문조사 데이터에 대한 그룹화된 빈도 분포의 예입니다.

먼저 크기 2의 그룹을 만든 다음 각 그룹에 속하는 데이터 세트의 개별 관측치 수를 계산했습니다. 예를 들어:

  • 7가족에는 동물이 1~2마리 있었습니다.
  • 3가족에는 3~4마리의 동물이 있었습니다.
  • 3가족에는 5~6마리의 동물이 있었습니다.
  • 2가족에는 7~8마리의 동물이 있었습니다.

생성할 수 있는 또 다른 유형의 빈도 분포는 그룹화되지 않은 빈도 분포 로, 이는 데이터 값 그룹이 아닌 각 개별 데이터 값의 빈도를 표시합니다.

다음은 설문조사 데이터에 대한 비클러스터형 빈도 분포의 예입니다.

그룹화되지 않은 빈도 분포의 예

이러한 유형의 빈도 분포를 통해 데이터 세트에서 서로 다른 값이 얼마나 자주 발생했는지 직접 확인할 수 있습니다. 예를 들어:

  • 4가족이 동물 1마리를 키웠어요
  • 3가족이 동물 2마리를 키웠어요
  • 2가족에는 3마리의 동물이 있었습니다
  • 한 가족에는 4마리의 동물이 있었습니다.

등등.

그룹화되지 않은 빈도 분포를 사용해야 하는 경우

그룹화되지 않은 빈도 분포는 각 개별 값이 데이터 세트에 나타나는 빈도를 확인하려는 경우 유용할 수 있습니다.

클러스터되지 않은 빈도 분포는 고유한 값이 몇 개만 있는 소규모 데이터 세트에서 가장 잘 작동합니다.

예를 들어, 이전 설문조사 데이터에는 고유한 값이 8개뿐이었기 때문에 클러스터되지 않은 빈도 분포를 만드는 것이 합리적이었습니다.

그러나 수백 개 또는 고유한 값을 포함하는 수천 개의 데이터 세트가 있는 경우 클러스터되지 않은 빈도 분포는 엄청나게 시간이 많이 걸리고 정보를 수집하기 어려울 것입니다.

더 큰 데이터 세트의 경우 그룹화된 빈도 분포를 구성하는 것이 합리적입니다.

그룹화되지 않은 빈도 분포를 시각화하는 방법

그룹화되지 않은 도수 분포의 값을 시각화하는 가장 간단한 방법은 각 개별 값의 도수를 간단한 그래프로 표시하는 도수 다각형을 만드는 것입니다.

샘플 데이터에 대한 빈도 다각형의 모양은 다음과 같습니다.

그룹화되지 않은 빈도 분포에 대한 빈도 다각형

이를 통해 데이터세트에 각 값이 얼마나 자주 나타나는지 빠르게 이해할 수 있습니다.

또는 단일 선이 아닌 막대를 사용하여 정확히 동일한 데이터를 표시하는 막대 차트를 만들 수 있습니다.

그룹화되지 않은 빈도 분포에 대한 막대 차트

두 그래프를 통해 데이터 세트의 값 분포를 빠르게 이해할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다