如何估计任何直方图的平均值和中位数
直方图是一种帮助我们可视化一组数据中值的分布的图表。
直方图的 x 轴显示数据值组,y 轴告诉我们数据集中每组有多少个观测值。
尽管直方图对于可视化分布很有用,但仅通过查看直方图来了解平均值和中值并不总是显而易见的。
虽然仅通过查看直方图不可能找到分布的准确平均值和中值,但可以估计这两个值。本教程解释了如何操作。
如何估计直方图的平均值
我们可以使用以下公式来找到任何直方图平均值的最佳估计:
平均值的最佳估计: Σm i n i / N
金子:
- mi : 第i个bin 的中间
- n i :第 i个bin 的频率
- N:总样本量
例如,考虑以下直方图:
我们对平均值的最佳估计是:
平均值 = (5.5*2 + 15.5*7 + 25.5*10 + 35.5*3 + 45.5*1) / 23 = 22.89 。
从直方图来看,这似乎是对平均值的合理估计。
如何估计直方图的中位数
我们可以使用以下公式来找到任何直方图中位数的最佳估计:
中位数的最佳估计: L + ((n/2 – F) / f) * w
金子:
- L:中间组的下限
- n:观察总数
- F:到中间组的累积频率
- f:中间组的频率
- w:中间组的宽度
再次考虑以下直方图:
我们对中位数的最佳估计是:
中位数 = 21 + ((25/2 – 9) / 10) * 9 = 24.15 。
从直方图来看,这似乎也是对中位数的合理估计。