ヒストグラムの平均と中央値を推定する方法
ヒストグラムは、一連のデータ内の値の分布を視覚化するのに役立つグラフです。
ヒストグラムの x 軸はデータ値のグループを表示し、y 軸はデータセット内の各グループに含まれる観測値の数を示します。
ヒストグラムは分布を視覚化するのに役立ちますが、ヒストグラムを見るだけでは平均値と中央値を知ることが必ずしも明らかであるとは限りません。
ヒストグラムを見るだけでは分布の正確な平均値と中央値を見つけることはできませんが、両方の値を推定することは可能です。このチュートリアルではその方法を説明します。
ヒストグラムの平均を推定する方法
次の式を使用して、ヒストグラムの平均の最適な推定値を見つけることができます。
平均の最良推定値: Σm i n i / N
金:
- m i : i番目のビンの中央
- n i : i番目のビンの周波数
- N:合計サンプルサイズ
たとえば、次のヒストグラムを考えてみましょう。
平均の最良の推定値は次のようになります。
平均 = (5.5*2 + 15.5*7 + 25.5*10 + 35.5*3 + 45.5*1) / 23 = 22.89 。
ヒストグラムを見ると、これは平均の妥当な推定値であるように見えます。
ヒストグラムの中央値を推定する方法
次の式を使用して、ヒストグラムの中央値の最適な推定値を見つけることができます。
中央値の最良推定値: L + ((n/2 – F) / f) * w
金:
- L:中群の下限値
- n:観測値の総数
- F:中間グループまでの累積度数
- f:中間グループの周波数
- w:中間グループの幅
もう一度、次のヒストグラムを考えてみましょう。
中央値の最良の推定値は次のようになります。
中央値 = 21 + ((25/2 – 9) / 10) * 9 = 24.15 。
ヒストグラムを見ると、これも中央値の妥当な推定値であるように見えます。