ヒストグラムの標準偏差を推定する方法
ヒストグラムは、データセット内の値の分布を視覚化する便利な方法を提供します。
ヒストグラムの x 軸はデータ値のグループを表示し、y 軸はデータセット内の各グループに含まれる観測値の数を示します。
ヒストグラムでは観測値がビンに配置されるため、ヒストグラムで表されるデータセットの正確な標準偏差を計算することはできませんが、標準偏差を推定することは可能です。
次の例は、これを行う方法を示しています。
ヒストグラムの標準偏差を推定する方法
ヒストグラムの標準偏差を推定するには、まず平均を推定する必要があります。
次の式を使用して平均を推定できます。
平均: Σm i ni / N
金:
- m i : i番目のビンの中央
- n i : i番目のビンの周波数
- N:合計サンプルサイズ
たとえば、次のヒストグラムがあるとします。
このヒストグラムの平均値を推定する方法は次のとおりです。
平均は22.89と推定されます。
注:各グループの中点は、範囲の下限値と上限値の平均を取ることで見つけることができます。たとえば、最初のグループの中点は次のように計算されます: (1+10) / 2 = 5.5。
平均値の推定値が得られたので、次の式を使用して標準偏差を推定できます。
標準偏差: √ Σn i (m i -μ) 2 / (N-1)
金:
- n i : i番目のビンの周波数
- m i : i番目のビンの中央
- μ : 平均値
- N:合計サンプルサイズ
この式をデータセットに適用する方法は次のとおりです。
データセットの標準偏差は9.6377と推定されます。
データセットの標準偏差と正確に一致することは保証されませんが (データセットの生データ値がわからないため)、これは標準偏差の最良の推定値を表します。
追加リソース
次のチュートリアルでは、グループにグループ化されたデータに関連するその他の一般的なタスクを実行する方法について説明します。
グループ化されたデータの分散を見つける方法
グループ化されたデータの中央値を見つける方法
グループ化されたデータモードを見つける方法