右偏直方图:示例和解释


直方图是一种图表,它允许我们可视化一组数据中值的分布。

如果直方图在分布的右侧有“尾部”,则称该直方图是右偏的

右偏直方图

注意:有时右偏直方图也称为正偏直方图

右偏直方图具有以下两个属性:

1. 分布的顶部位于左侧。

右偏直方图的峰值

2. 平均值大于中位数。

右偏直方图中的平均值与中位数

是什么使直方图正确倾斜?

当最小可能值有限制但最大可能值没有限制时,直方图通常是右偏的。

右偏直方图最明显的现实例子是一个国家的收入分配。

一个人可以赚取的最低收入为零美元,而一个人可以赚取的最高收入没有上限。

一般来说,大多数人的年收入约为4万美元,但也有少数例外,年收入可达数百万美元。

当我们创建直方图来可视化收入分配时,它自然会倾斜:

右偏直方图的现实示例

为什么右偏直方图中的平均值大于中位数?

在右偏直方图中,平均值大于中位数,因为分布右侧“尾部”的高值会极大地夸大平均值。

举个简单的例子,假设我们有以下数据集,其中包含 10 个人的收入:

数据集 1: $30,000、$35,000、$35,000、$40,000、$50,000、$55,000、$55,000、$70,000、$90,000、$110,000

以下是该数据集的平均值和中值:

  • 平均:$57k
  • 中位数:$52.5k

现在假设我们有另一个包含完全相同收入的数据集,只是最后一个值现在是 250 万美元:

数据集 2: 30,000 美元、35,000 美元、35,000 美元、40,000 美元、50,000 美元、55,000 美元、55,000 美元、70,000 美元、90,000 美元、250 万美元

以下是该数据集的平均值和中值:

  • 平均:29.6万美元
  • 中位数:$52.5k

后一个异常值导致平均收入显着增加。

如果我们绘制这个分布,它将是一个右偏直方图,价值 250 万美元位于直方图的右侧“尾部”。

右偏直方图和左偏直方图之间的差异

与右偏直方图相反的是左偏直方图

这是一种在分布左侧有“尾部”的直方图:

这种类型的直方图具有以下属性:

1. 分布的峰值在右侧。

2. 平均值低于中位数。

请注意,这些与右偏直方图的属性完全相反。

本教程中了解有关左偏直方图的更多信息。

其他资源

以下教程提供有关直方图的其他信息:

如何估计任何直方图的平均值和中位数
如何估计任何直方图的标准差
如何描述直方图的形状

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注