수업 수(통계)

에 의해 벤자민 앤더슨 8월 4, 2023 통계 댓글 0개

이 문서에서는 통계에서 클래스 수를 찾는 방법을 설명합니다. 또한 클래스 수를 찾은 후 간격의 너비가 어떻게 계산되는지 알아보고, 추가로 몇 가지 구체적인 예도 볼 수 있습니다.

통계에서 클래스 수를 계산하는 방법

주로 통계학에서는 데이터 표본에 대한 이상적인 클래스 수를 계산하는 방법으로 수식인 스터지스의 법칙(Sturges’ rule)과 전체 데이터 수의 제곱근을 구하는 근법(root method) 두 가지가 있습니다.

샘플에 따라 하나의 방법 또는 다른 방법을 사용하는 것이 좋습니다. 아래에서는 두 방법 모두 예를 들어 설명합니다.

스터지스의 법칙

Sturges의 규칙은 데이터 세트를 나누어야 하는 이상적인 클래스 수 또는 간격을 계산하는 데 사용되는 규칙입니다. 특히 Sturges의 규칙 공식은 적절한 클래스 수는 총 데이터 포인트 수의 밑수 2 로그에 1을 더한 것과 같다고 명시합니다.

$c=1+\log_2(N)$

금

$c$

클래스 또는 간격의 수입니다.

$N$

표본의 총 관측치 수입니다.

대부분의 계산기는 밑이 10인 로그를 사용한 계산만 허용합니다. 이 경우 다음과 같은 공식을 사용할 수 있습니다.

$c=1+\cfrac{\log(N)}{\log(2)}$

예를 들어, 100개의 관측값으로 구성된 통계 샘플이 있는 경우 Sturges의 규칙에 따라 데이터를 그룹화해야 하는 클래스 수는 다음과 같이 계산됩니다.

$\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}$

따라서 총 100개의 데이터 포인트가 있는 샘플의 경우 데이터를 8개의 서로 다른 간격으로 나누어야 합니다.

루트 방법

Sturges의 규칙이 확실히 더 잘 알려져 있지만 클래스 수를 계산하기 위해 통계에서 널리 사용되는 또 다른 방법은 표본 크기의 제곱근을 계산하는 것입니다.

따라서 이상적인 클래스 수를 계산하는 또 다른 공식은 다음과 같습니다.

$c=\sqrt{N}$

금

$c$

클래스 또는 간격의 수입니다.

$N$

표본에 있는 데이터 항목의 총 개수입니다.

예를 들어, 총 150개의 데이터가 있는 경우 데이터를 나누어야 하는 간격 수는 다음과 같이 계산됩니다.

$c=\sqrt{150}=12,25 \approx 12$

이전 공식은 표본 크기가 200개 미만일 때 사용되지만, 데이터가 200개 이상인 경우 세제곱근을 사용하여 클래스 수를 계산하는 것이 좋습니다.

$c=\sqrt[3]{N}$

금

$c$

클래스 또는 간격의 수입니다.

$N$

표본에 있는 데이터 항목의 총 개수입니다.

클래스 수 및 간격 폭

Bin 수를 계산한 후에는 다음 공식을 사용하여 각 간격의 너비를 계산할 수 있습니다.

$\text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}$

예를 들어, 간격 너비가 어떻게 계산되는지 확인할 수 있는 연습 문제가 아래에 나와 있습니다.

다음과 같은 통계 데이터가 기록되었습니다. Sturges의 규칙을 사용하여 클래스 수를 계산한 다음 각 구간의 너비를 결정합니다.

$35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53$

$21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7$

$67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98$

위에서 본 것처럼 데이터를 그룹화해야 하는 클래스 수를 결정하기 위해 Sturges의 규칙을 적용합니다. 이 경우에는 39개의 데이터가 있으므로 수식에서 매개변수 N을 39로 바꿔야 합니다.

$\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}$

이제 적절한 클래스 수를 알았으므로 각 클래스의 너비를 계산해 보겠습니다. 이를 위해서는 먼저 샘플 데이터의 범위를 계산해야 합니다.

$R=98-2=96$

➤ 참고: 통계의 범위 공식

그리고 샘플의 범위를 알고 나면 찾은 값을 이전에 계산된 클래스 수로 나눕니다(6).

$\text{Amplitud de intervalo}=\cfrac{96}{6}=16$

따라서 모든 클래스의 너비는 16단위여야 합니다. 따라서 우리가 달성할 수 있는 클래스는 다음과 같습니다.

$\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}$

빈도 분포의 클래스 수

마지막으로, 도수분포(또는 빈도표)를 만들 때 클래스 수를 계산하는 것이 중요합니다. 이렇게 하면 데이터를 여러 구간으로 빠르게 분리한 다음 각 구간의 모든 유형의 빈도를 찾을 수 있습니다. .

그것이 무엇인지 모르는 경우, 빈도 분포는 각 간격에 대한 모든 빈도 유형을 나열하는 표입니다. 따라서 각 행은 서로 다른 클래스이고 각 열은 서로 다른 빈도 유형을 갖습니다.

그룹화된 데이터가 포함된 빈도 분포의 예를 보려면 다음 링크를 클릭하세요.

➤ 참고: 그룹화된 데이터의 빈도 분포

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

통계에서 클래스 수를 계산하는 방법

스터지스의 법칙

루트 방법

클래스 수 및 간격 폭

빈도 분포의 클래스 수

저자 소개

벤자민 앤더슨

의견을 추가하다