右偏直方图:示例和解释
直方图是一种图表,它允许我们可视化一组数据中值的分布。
如果直方图在分布的右侧有“尾部”,则称该直方图是右偏的:
注意:有时右偏直方图也称为正偏直方图。
右偏直方图具有以下两个属性:
1. 分布的顶部位于左侧。
2. 平均值大于中位数。
是什么使直方图正确倾斜?
当最小可能值有限制但最大可能值没有限制时,直方图通常是右偏的。
右偏直方图最明显的现实例子是一个国家的收入分配。
一个人可以赚取的最低收入为零美元,而一个人可以赚取的最高收入没有上限。
一般来说,大多数人的年收入约为4万美元,但也有少数例外,年收入可达数百万美元。
当我们创建直方图来可视化收入分配时,它自然会倾斜:
为什么右偏直方图中的平均值大于中位数?
在右偏直方图中,平均值大于中位数,因为分布右侧“尾部”的高值会极大地夸大平均值。
举个简单的例子,假设我们有以下数据集,其中包含 10 个人的收入:
数据集 1: $30,000、$35,000、$35,000、$40,000、$50,000、$55,000、$55,000、$70,000、$90,000、$110,000
以下是该数据集的平均值和中值:
- 平均:$57k
- 中位数:$52.5k
现在假设我们有另一个包含完全相同收入的数据集,只是最后一个值现在是 250 万美元:
数据集 2: 30,000 美元、35,000 美元、35,000 美元、40,000 美元、50,000 美元、55,000 美元、55,000 美元、70,000 美元、90,000 美元、250 万美元
以下是该数据集的平均值和中值:
- 平均:29.6万美元
- 中位数:$52.5k
后一个异常值导致平均收入显着增加。
如果我们绘制这个分布,它将是一个右偏直方图,价值 250 万美元位于直方图的右侧“尾部”。
右偏直方图和左偏直方图之间的差异
与右偏直方图相反的是左偏直方图。
这是一种在分布左侧有“尾部”的直方图:
这种类型的直方图具有以下属性:
1. 分布的峰值在右侧。
2. 平均值低于中位数。
请注意,这些与右偏直方图的属性完全相反。
在本教程中了解有关左偏直方图的更多信息。
其他资源
以下教程提供有关直方图的其他信息: