グループ化されたデータの平均と標準偏差を見つける方法
何らかの方法でグループ化されたデータの平均と標準偏差を計算したいことがよくあります。たとえば、次のようなグループ化されたデータがあるとします。
生データの値がわからないため、正確な平均と標準偏差を計算することはできませんが、平均と標準偏差を推定することは可能です。
次の手順では、これを行う方法について説明します。
グループ化されたデータの平均を計算する
次の式を使用して、グループ化されたデータの平均を推定できます。
平均: Σm i ni / N
金:
- mi : i番目のグループの真ん中
- n i : i番目のグループの周波数
- N:合計サンプルサイズ
この式を前のデータセットに適用する方法は次のとおりです。
データセットの平均は22.89であることがわかります。
注:各グループの中点は、範囲の下限値と上限値の平均を取ることで見つけることができます。たとえば、最初のグループの中点は次のように計算されます: (1+10) / 2 = 5.5。
グループ化されたデータの標準偏差を計算します
次の式を使用して、グループ化されたデータの標準偏差を推定できます。
標準偏差: √ Σn i (m i -μ) 2 / (N-1)
金:
- n i : i番目のグループの周波数
- mi : i番目のグループの真ん中
- μ : 平均値
- N:合計サンプルサイズ
この式をデータセットに適用する方法は次のとおりです。
データセットの標準偏差は9.6377であることがわかります。
追加リソース
ヒストグラムの平均と中央値を推定する方法
グループ化されたデータのパーセンタイル ランキングを計算する方法
グループ化されたデータの中央値を見つける方法