그룹화된 데이터

이 도움말에서는 그룹화된 데이터가 무엇인지, 데이터를 그룹화하는 방법에 대해 설명합니다. 또한 데이터가 간격별로 그룹화되어 있는 해결된 연습 문제도 찾을 수 있습니다.

그룹화된 데이터란 무엇입니까?

통계에서 비닝된 데이터는 간격으로 그룹화된 데이터입니다. 즉, 그룹화된 데이터는 함께 연구할 수 있도록 일정한 간격으로 수집된 데이터입니다.

따라서 통계 데이터 세트를 그룹화할 때 서로 다른 간격으로 분리되므로 각 데이터 조각은 하나의 간격에만 속할 수 있습니다.

간단히 말해서, 통계에서 데이터 클러스터링을 사용하면 여러 데이터를 공동으로 분석할 수 있으므로 간격 내에 그룹화된 데이터가 단일 데이터 조각으로 처리됩니다. 또한 데이터 풀링은 표본이 매우 클 때 매우 유용합니다.

그룹화된 데이터의 예

그룹화된 데이터의 정의를 살펴보면, 아래에서는 데이터 세트가 서로 다른 간격으로 그룹화되는 구체적인 예를 보여줍니다.

  • 50명의 서로 다른 사람들의 표본 크기를 측정하고 모든 값을 다음 데이터 테이블에 기록했습니다. 데이터 세트를 간격으로 그룹화한 다음 데이터를 그래프로 표시합니다.

먼저 데이터를 간격으로 분리해야 합니다. 이에 대한 방법은 여러 가지가 있지만 Sturges의 규칙을 사용하면 이상적인 간격 수를 계산할 수 있기 때문에 가장 많이 사용됩니다.

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(50)\\[2ex]c=1+5,64\\[2ex]c=6,64\\[2ex]c\approx 7\end{array}

따라서 데이터를 7개의 서로 다른 간격으로 분리해야 합니다. 이제 각 간격이 가져야 하는 너비를 알아야 합니다. 이렇게 하려면 최대값에서 최소값을 뺀 값을 총 간격 수로 나누면 됩니다.

a=\cfrac{\text{valor m\'aximo}-\text{valor m\'inimo}}{c}=\cfrac{205-145}{7}=8,57\approx 9

즉, 진폭이 9인 간격은 7개가 있어야 하므로 Sturges의 법칙에 따라 계산된 간격은 다음과 같습니다.

[145,154)

[154,163)

[163,172)

[172,181)

[181,190)

[190,199)

[199,208)

간격을 계산한 후에는 각 간격에 데이터 조각이 나타나는 횟수를 계산하고 그룹화된 데이터로 테이블을 구성합니다.

그룹화된 데이터(상대 빈도, 누적 빈도 등)에서 더 많은 빈도 유형을 계산할 수 있다는 점을 명심하세요. 그룹화된 데이터로 전체 빈도표를 만드는 방법을 보려면 여기를 클릭하세요.

마지막으로, 각 간격의 빈도가 포함된 테이블에서 데이터를 히스토그램으로 그룹화하여 그래프로 표시할 수 있습니다.

Sturges 규칙 히스토그램, 통계

그룹화된 데이터와 그룹화되지 않은 데이터

그룹 해제된 데이터는 간격으로 분리되지 않은 데이터이지만 각 값은 별도로 연구됩니다.

위에서 설명한 예에 따라 데이터를 그룹화하지 않았다면 각 값의 빈도를 찾아야 했을 것입니다. 즉, 158, 165, 174 등의 값이 몇 배인지 계산했어야 합니다. 반복됩니다. 하지만 이 경우에는 데이터의 양이 많고, 게다가 유사한 값도 많기 때문에 데이터를 간격별로 그룹화하는 것이 더 나았습니다.

따라서 통계 연구 중에 계산을 수행하기 전에 데이터를 간격별로 그룹화해야 하는지 여부를 결정하는 것이 중요합니다. 이는 나머지 조사의 조건이 되기 때문입니다.

데이터는 언제 통합해야 합니까?

일반적으로 변수가 연속형인 경우 데이터를 간격으로 그룹화해야 합니다. 변수가 연속형인 경우 일반적으로 값이 많고 서로 매우 가깝기 때문에 연구를 단순화하기 위해 간격으로 그룹화할 수 있습니다.

논리적으로는 변수가 연속적이지 않더라도 데이터가 많으면 구간별로 그룹화할 수 있어 통계 분석이 더 쉬워집니다. 그러나 일반적으로 데이터를 그룹화하는 기준은 변수 유형입니다. 즉, 변수가 연속형인 경우 데이터는 일반적으로 간격으로 분리됩니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다