未分组的频率分布:定义和示例
假设我们进行一项调查,询问 15 个家庭家里有多少只动物。结果如下:
1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 7, 8
总结这些结果的一种方法是创建频率分布,它告诉我们不同值在数据集中出现的频率。
我们经常使用聚类频率分布,其中我们创建值组,然后总结数据集中属于这些组的观察值的数量。
以下是我们的调查数据的分组频率分布示例:
我们首先创建大小为 2 的组,然后计算数据集中落入每个组的单个观测值的数量。例如:
- 7 个家庭有 1 或 2 只动物
- 3个家庭有3或4只动物
- 3个家庭有5或6只动物
- 2个家庭有7或8只动物
我们可以创建的另一种类型的频率分布是未分组的频率分布,它显示每个单独数据值的频率而不是数据值组。
以下是我们的调查数据的非聚类频率分布示例:
这种类型的频率分布使我们能够直接看到数据集中出现不同值的频率。例如:
- 4个家庭养了1只动物
- 3个家庭有2只动物
- 2个家庭有3只动物
- 1 个家庭有 4 只动物
等等。
何时使用未分组的频率分布
当您想要查看每个单独值在数据集中出现的频率时,未分组的频率分布非常有用。
请注意,非聚类频率分布最适合仅存在几个唯一值的小型数据集。
例如,在我们之前的调查数据中,只有 8 个唯一值,因此创建非聚类频率分布是有意义的。
然而,如果我们有数千个数据集,其中包含数百个或多个唯一值,则非聚类频率分布将非常耗时并且难以从中收集信息。
对于较大的数据集,构建分组频率分布是有意义的。
如何可视化未分组的频率分布
可视化未分组频率分布中的值的最简单方法是创建频率多边形,它在简单的图表中显示每个单独值的频率。
我们的样本数据的频率多边形如下所示:
这有助于我们快速了解每个值在数据集中出现的频率。
或者,我们可以创建一个条形图,使用条形图而不是单线来显示完全相同的数据:
这两个图都可以让我们快速了解数据集中值的分布。