スタージェスとは何ですか?ルーラー? (定義&例)


ヒストグラムは、一連のデータ内の値の分布を視覚化するのに役立つグラフです。

ヒストグラムで使用されるボックスの数は、データの解釈方法に大きな影響を与える可能性があることがわかりました。

使用するグループが少なすぎると、データ内の実際の基礎となるパターンが隠れてしまう可能性があります。

また、使用するグループが多すぎる場合は、データセット内のノイズを単純に視覚化することができます。

幸いなことに、スタージェス則として知られる方法を使用して、ヒストグラムで使用する最適なボックスの数を決定できます。

スタージェスのルールでは、次の式を使用して、ヒストグラムで使用する最適なグループ数を決定します。

最適なビン = ⌈log 2 n + 1⌉

金:

  • n:データセット内の観測値の総数。
  • ⌈ ⌉: 「天井」を意味する記号。つまり、答えを最も近い整数に四捨五入します。

例: スタージェスの法則

合計 n = 31 の観測値を含む次のデータセットがあるとします。

スタージェスのルールを使用して、これらの値をヒストグラムで視覚化するために使用するボックスの最適な数を決定できます。

最適なビン= ⌈log 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6

スタージェスのルールによれば、この値の分布を視覚化するために使用するヒストグラムでは 6 つのビンを使用する必要があります。

このデータセットの 6 つのグループを含むヒストグラムは次のようになります。

スタージェスの法則を使用してヒストグラムで使用するボックスの数を決定する

データ内のノイズを単純に視覚化するには多すぎず、基礎となる値の分布を把握するにはこれで十分であることに注目してください。

スタージェス則の共通の価値観

次の表は、スタージェスの法則に従って、データセット内の観測値の総数に基づいてヒストグラムで使用する最適なグループ数を示しています。

さまざまなサンプルサイズに対するスタージェスの法則

スタージェスの法則の代替案

スタージェス ルールは、ヒストグラムで使用する最適なビンの数を決定する最も一般的な方法ですが、次のような代替方法がいくつかあります。

平方根の法則: ボックスの数 = ⌈√ n

米のルール:ビンの数 = ⌈2 * 3n

フリードマン・ディアコニスの法則:ボックスの数 = (2*IQR) / 3nここで、 IQRは四分位範囲です。

ボーナス: スタージェス ルール計算ツール

この無料のオンライン計算ツールを使用すると、スタージェス ルールが自動的に適用され、データ セットのサイズに基づいてヒストグラムに使用する最適なグループ数が決定されます。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です