什么是边际分布?
双向频率表是显示两个分类变量的频率(或“计数”)的表。
例如,下面的双向表显示了一项调查结果,该调查询问了 100 个人他们喜欢哪种运动:棒球、篮球或足球。
行显示受访者的性别,列表示他们选择的运动:
在此示例中,有两个变量:运动和性别。
边际分布只是这些单独变量中每一个变量的分布。在双向表中,边际分布显示在表的边距中:
例如,我们可以说体育运动的边际分布是:
- 棒球: 36
- 篮球: 31
- 足球: 33
我们还可以将体育运动的边际分布写成百分比(即总共 100 名受访者):
- 棒球: 36/100 = 36%
- 篮球: 31/100 = 31%
- 足球: 33/100 = 33%
我们可以说边际性别分布是:
- 男性: 48(或48%)
- 女性: 52(或52%)
注意:边际分布加起来始终为 100%。
为什么使用边际分布?
边际分布很有用,因为尽管我们经常收集两个变量(如运动和性别)的数据,但有时我们只对一个变量有具体问题。
例如,我们可能想了解仅基于性别的调查受访者的分布。
在这种情况下,我们可以使用边际分布发现 48% 的受访者是男性,52% 的受访者是女性。
使用以下示例作为练习,以更好地理解边际分布。
示例 1:百分比的边际分布
下面的双向表显示了一项调查的结果,该调查询问了 238 人他们喜欢哪种电影:
问题:按电影类型划分的边际分布是多少(百分比)?
答:电影类型的边际分布如下:
- 幻想: 47/238 = 19.7%
- 戏剧: 88/238 = 37%
- 行动: 103/238 = 43.3%
问题:边际性别分布是多少(百分比)?
答案:按性别划分的边际分布如下:
- 男性: 122/238 = 51.3%
- 女性: 116/238 = 48.7%
示例 2:账户的边际分配
下面的双向表显示了一个班级 64 名学生根据学习时间的考试成绩:
问题:考试成绩的边际分布(以数字表示)是怎样的?
答:考试成绩的边际分布为:
- 71-80: 22
- 81-90: 22
- 91-100: 20
问题:学习时间(数量)的边际分布是怎样的?
答案:学习时数的边际分布为:
- 1小时: 14
- 2小时: 14
- 3小时: 16
- 4小时: 20
请注意,边际分布的总数与表中 64 名学生的总数相匹配。