수업 수(통계)
이 문서에서는 통계에서 클래스 수를 찾는 방법을 설명합니다. 또한 클래스 수를 찾은 후 간격의 너비가 어떻게 계산되는지 알아보고, 추가로 몇 가지 구체적인 예도 볼 수 있습니다.
통계에서 클래스 수를 계산하는 방법
주로 통계학에서는 데이터 표본에 대한 이상적인 클래스 수를 계산하는 방법으로 수식인 스터지스의 법칙(Sturges’ rule)과 전체 데이터 수의 제곱근을 구하는 근법(root method) 두 가지가 있습니다.
샘플에 따라 하나의 방법 또는 다른 방법을 사용하는 것이 좋습니다. 아래에서는 두 방법 모두 예를 들어 설명합니다.
스터지스의 법칙
Sturges의 규칙은 데이터 세트를 나누어야 하는 이상적인 클래스 수 또는 간격을 계산하는 데 사용되는 규칙입니다. 특히 Sturges의 규칙 공식은 적절한 클래스 수는 총 데이터 포인트 수의 밑수 2 로그에 1을 더한 것과 같다고 명시합니다.
![]()
금
![]()
클래스 또는 간격의 수입니다.
![]()
표본의 총 관측치 수입니다.
대부분의 계산기는 밑이 10인 로그를 사용한 계산만 허용합니다. 이 경우 다음과 같은 공식을 사용할 수 있습니다.
![]()
예를 들어, 100개의 관측값으로 구성된 통계 샘플이 있는 경우 Sturges의 규칙에 따라 데이터를 그룹화해야 하는 클래스 수는 다음과 같이 계산됩니다.
![Rendered by QuickLaTeX.com \begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-f5bb532d94df60469d5d23fd0f2c4712_l3.png)
따라서 총 100개의 데이터 포인트가 있는 샘플의 경우 데이터를 8개의 서로 다른 간격으로 나누어야 합니다.
루트 방법
Sturges의 규칙이 확실히 더 잘 알려져 있지만 클래스 수를 계산하기 위해 통계에서 널리 사용되는 또 다른 방법은 표본 크기의 제곱근을 계산하는 것입니다.
따라서 이상적인 클래스 수를 계산하는 또 다른 공식은 다음과 같습니다.
![]()
금
![]()
클래스 또는 간격의 수입니다.
![]()
표본에 있는 데이터 항목의 총 개수입니다.
예를 들어, 총 150개의 데이터가 있는 경우 데이터를 나누어야 하는 간격 수는 다음과 같이 계산됩니다.
![]()
이전 공식은 표본 크기가 200개 미만일 때 사용되지만, 데이터가 200개 이상인 경우 세제곱근을 사용하여 클래스 수를 계산하는 것이 좋습니다.
![]()
금
![]()
클래스 또는 간격의 수입니다.
![]()
표본에 있는 데이터 항목의 총 개수입니다.
클래스 수 및 간격 폭
Bin 수를 계산한 후에는 다음 공식을 사용하여 각 간격의 너비를 계산할 수 있습니다.
![]()
예를 들어, 간격 너비가 어떻게 계산되는지 확인할 수 있는 연습 문제가 아래에 나와 있습니다.
- 다음과 같은 통계 데이터가 기록되었습니다. Sturges의 규칙을 사용하여 클래스 수를 계산한 다음 각 구간의 너비를 결정합니다.
![]()
![]()
![]()
위에서 본 것처럼 데이터를 그룹화해야 하는 클래스 수를 결정하기 위해 Sturges의 규칙을 적용합니다. 이 경우에는 39개의 데이터가 있으므로 수식에서 매개변수 N을 39로 바꿔야 합니다.
![Rendered by QuickLaTeX.com \begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-b7b884d13f1c20fae5807dceddff2072_l3.png)
이제 적절한 클래스 수를 알았으므로 각 클래스의 너비를 계산해 보겠습니다. 이를 위해서는 먼저 샘플 데이터의 범위를 계산해야 합니다.
![]()
그리고 샘플의 범위를 알고 나면 찾은 값을 이전에 계산된 클래스 수로 나눕니다(6).
![]()
따라서 모든 클래스의 너비는 16단위여야 합니다. 따라서 우리가 달성할 수 있는 클래스는 다음과 같습니다.
![Rendered by QuickLaTeX.com \begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}](https://statorials.org/wp-content/ql-cache/quicklatex.com-85277caa3ce99fe8c9c29f5df7d79933_l3.png)
빈도 분포의 클래스 수
마지막으로, 도수분포(또는 빈도표)를 만들 때 클래스 수를 계산하는 것이 중요합니다. 이렇게 하면 데이터를 여러 구간으로 빠르게 분리한 다음 각 구간의 모든 유형의 빈도를 찾을 수 있습니다. .
그것이 무엇인지 모르는 경우, 빈도 분포는 각 간격에 대한 모든 빈도 유형을 나열하는 표입니다. 따라서 각 행은 서로 다른 클래스이고 각 열은 서로 다른 빈도 유형을 갖습니다.
그룹화된 데이터가 포함된 빈도 분포의 예를 보려면 다음 링크를 클릭하세요.