クラス数(統計)

この記事では、統計でクラスの数を見つける方法について説明します。クラス数を求めた後、間隔の幅がどのように計算されるかについても説明し、さらにいくつかの具体的な例を見ることができます。

統計におけるクラスの数を計算する方法

主に統計学では、データ サンプルの理想的なクラス数を計算する方法が 2 つあります。1 つは公式であるスタージェス則、もう 1 つはデータの総数の平方根を求めるルート法です。

サンプルに応じて、いずれかの方法を使用することをお勧めします。両方の方法を例を挙げて以下に説明します。

スタージェスの法則

スタージェスの法則は、データセットを分割する理想的なクラス数または間隔を計算するために使用されるルールです。具体的には、スタージェスの法則の公式では、適切なクラス数は 1 にデータ ポイントの総数の底 2 の対数を加えたものに等しいと述べています。

c=1+\log_2(N)

c

はクラスまたはインターバルの数、および

N

サンプル内の観測値の合計数です。

ほとんどの電卓では、10 を底とする対数での計算のみが可能です。この場合、次の同等の式を使用できます。

c=1+\cfrac{\log(N)}{\log(2)}

たとえば、100 個の観測値の統計サンプルがある場合、スタージェスの法則に従って、データをグループ化するクラスの数は次のように計算されます。

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

したがって、合計 100 個のデータ ポイントを持つサンプルの場合、データは 8 つの異なる間隔に分割する必要があります。

ルートメソッド

確かにスタージェスの法則の方がよく知られていますが、クラス数を計算するために統計学で広く使用されている別の方法は、サンプル サイズの平方根を計算することです。

したがって、理想的なクラス数を計算する別の式は次のとおりです。

c=\sqrt{N}

c

はクラスまたはインターバルの数、および

N

サンプル内のデータ項目の総数です。

たとえば、合計 150 個のデータがある場合、データを分割する必要がある間隔の数の計算は次のようになります。

c=\sqrt{150}=12,25 \approx 12

前の式はサンプル サイズが 200 未満の場合に使用されますが、データが 200 以上の場合は、立方根を取得してクラスの数を計算する方が適切です。

c=\sqrt[3]{N}

c

はクラスまたはインターバルの数、および

N

サンプル内のデータ項目の総数です。

クラス数とインターバル幅

ビンの数を計算したら、次の式を使用して各間隔の幅を計算できます。

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

例として、間隔の幅がどのように計算されるかを確認できるように、以下の演習を解決します。

  • 以下の統計データが記録されました。スタージェス則を使用してクラスの数を計算し、各間隔の幅を決定します。

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

上で見たように、データをグループ化するクラスの数を決定するには、スタージェス ルールを適用します。この場合、データは 39 個あるため、式ではパラメーターN を39 に置き換える必要があります。

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

適切なクラス数がわかったので、各クラスの幅を計算してみましょう。これを行うには、まずサンプル データの範囲を計算する必要があります。

R=98-2=96

サンプルの範囲がわかったら、見つかった値を前に計算したクラスの数で割ります (6)。

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

したがって、すべてのクラスの幅は 16 単位でなければなりません。したがって、達成できるクラスは次のとおりです。

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

度数分布内のクラスの数

最後に、度数分布 (または度数表) を作成する場合、クラスの数を計算することが重要であることに注意してください。これにより、データをさまざまな間隔にすばやく分割し、各間隔のすべてのタイプの度数を見つけることができます。 。

それが何であるかわからない場合のために説明すると、度数分布は、各間隔のすべての度数タイプをリストした表です。したがって、各行は異なるクラスであり、各列は異なる頻度タイプを持ちます。

グループ化されたデータを含む度数分布の例を表示するには、次のリンクをクリックしてください。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です