수업 수(통계)

이 문서에서는 통계에서 클래스 수를 찾는 방법을 설명합니다. 또한 클래스 수를 찾은 후 간격의 너비가 어떻게 계산되는지 알아보고, 추가로 몇 가지 구체적인 예도 볼 수 있습니다.

통계에서 클래스 수를 계산하는 방법

주로 통계학에서는 데이터 표본에 대한 이상적인 클래스 수를 계산하는 방법으로 수식인 스터지스의 법칙(Sturges’ rule)과 전체 데이터 수의 제곱근을 구하는 근법(root method) 두 가지가 있습니다.

샘플에 따라 하나의 방법 또는 다른 방법을 사용하는 것이 좋습니다. 아래에서는 두 방법 모두 예를 들어 설명합니다.

스터지스의 법칙

Sturges의 규칙은 데이터 세트를 나누어야 하는 이상적인 클래스 수 또는 간격을 계산하는 데 사용되는 규칙입니다. 특히 Sturges의 규칙 공식은 적절한 클래스 수는 총 데이터 포인트 수의 밑수 2 로그에 1을 더한 것과 같다고 명시합니다.

c=1+\log_2(N)

c

클래스 또는 간격의 수입니다.

N

표본의 총 관측치 수입니다.

대부분의 계산기는 밑이 10인 로그를 사용한 계산만 허용합니다. 이 경우 다음과 같은 공식을 사용할 수 있습니다.

c=1+\cfrac{\log(N)}{\log(2)}

예를 들어, 100개의 관측값으로 구성된 통계 샘플이 있는 경우 Sturges의 규칙에 따라 데이터를 그룹화해야 하는 클래스 수는 다음과 같이 계산됩니다.

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

따라서 총 100개의 데이터 포인트가 있는 샘플의 경우 데이터를 8개의 서로 다른 간격으로 나누어야 합니다.

루트 방법

Sturges의 규칙이 확실히 더 잘 알려져 있지만 클래스 수를 계산하기 위해 통계에서 널리 사용되는 또 다른 방법은 표본 크기의 제곱근을 계산하는 것입니다.

따라서 이상적인 클래스 수를 계산하는 또 다른 공식은 다음과 같습니다.

c=\sqrt{N}

c

클래스 또는 간격의 수입니다.

N

표본에 있는 데이터 항목의 총 개수입니다.

예를 들어, 총 150개의 데이터가 있는 경우 데이터를 나누어야 하는 간격 수는 다음과 같이 계산됩니다.

c=\sqrt{150}=12,25 \approx 12

이전 공식은 표본 크기가 200개 미만일 때 사용되지만, 데이터가 200개 이상인 경우 세제곱근을 사용하여 클래스 수를 계산하는 것이 좋습니다.

c=\sqrt[3]{N}

c

클래스 또는 간격의 수입니다.

N

표본에 있는 데이터 항목의 총 개수입니다.

클래스 수 및 간격 폭

Bin 수를 계산한 후에는 다음 공식을 사용하여 각 간격의 너비를 계산할 수 있습니다.

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

예를 들어, 간격 너비가 어떻게 계산되는지 확인할 수 있는 연습 문제가 아래에 나와 있습니다.

  • 다음과 같은 통계 데이터가 기록되었습니다. Sturges의 규칙을 사용하여 클래스 수를 계산한 다음 각 구간의 너비를 결정합니다.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

위에서 본 것처럼 데이터를 그룹화해야 하는 클래스 수를 결정하기 위해 Sturges의 규칙을 적용합니다. 이 경우에는 39개의 데이터가 있으므로 수식에서 매개변수 N을 39로 바꿔야 합니다.

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

이제 적절한 클래스 수를 알았으므로 각 클래스의 너비를 계산해 보겠습니다. 이를 위해서는 먼저 샘플 데이터의 범위를 계산해야 합니다.

R=98-2=96

그리고 샘플의 범위를 알고 나면 찾은 값을 이전에 계산된 클래스 수로 나눕니다(6).

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

따라서 모든 클래스의 너비는 16단위여야 합니다. 따라서 우리가 달성할 수 있는 클래스는 다음과 같습니다.

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

빈도 분포의 클래스 수

마지막으로, 도수분포(또는 빈도표)를 만들 때 클래스 수를 계산하는 것이 중요합니다. 이렇게 하면 데이터를 여러 구간으로 빠르게 분리한 다음 각 구간의 모든 유형의 빈도를 찾을 수 있습니다. .

그것이 무엇인지 모르는 경우, 빈도 분포는 각 간격에 대한 모든 빈도 유형을 나열하는 표입니다. 따라서 각 행은 서로 다른 클래스이고 각 열은 서로 다른 빈도 유형을 갖습니다.

그룹화된 데이터가 포함된 빈도 분포의 예를 보려면 다음 링크를 클릭하세요.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다