什么是边际分布?


双向频率表是显示两个分类变量的频率(或“计数”)的表。

例如,下面的双向表显示了一项调查结果,该调查询问了 100 个人他们喜欢哪种运动:棒球、篮球或足球。

行显示受访者的性别,列表示他们选择的运动:

在此示例中,有两个变量:运动和性别。

边际分布只是这些单独变量中每一个变量的分布。在双向表中,边际分布显示在表的边距中:

边际分布

例如,我们可以说体育运动的边际分布是:

  • 棒球: 36
  • 篮球: 31
  • 足球: 33

我们还可以将体育运动的边际分布写成百分比(即总共 100 名受访者):

  • 棒球: 36/100 = 36%
  • 篮球: 31/100 = 31%
  • 足球: 33/100 = 33%

我们可以说边际性别分布是:

  • 男性: 48(或48%)
  • 女性: 52(或52%)

注意:边际分布加起来始终为 100%。

为什么使用边际分布?

边际分布很有用,因为尽管我们经常收集两个变量(如运动和性别)的数据,但有时我们只对一个变量有具体问题。

例如,我们可能想了解仅基于性别的调查受访者的分布。

在这种情况下,我们可以使用边际分布发现 48% 的受访者是男性,52% 的受访者是女性。

使用以下示例作为练习,以更好地理解边际分布。

示例 1:百分比的边际分布

下面的双向表显示了一项调查的结果,该调查询问了 238 人他们喜欢哪种电影:

双向表边际分布示例

问题:按电影类型划分的边际分布是多少(百分比)?

答:电影类型的边际分布如下:

  • 幻想: 47/238 = 19.7%
  • 戏剧: 88/238 = 37%
  • 行动: 103/238 = 43.3%

问题:边际性别分布是多少(百分比)?

答案:按性别划分的边际分布如下:

  • 男性: 122/238 = 51.3%
  • 女性: 116/238 = 48.7%

示例 2:账户的边际分配

下面的双向表显示了一个班级 64 名学生根据学习时间的考试成绩:

边际分布示例

问题:考试成绩的边际分布(以数字表示)是怎样的?

答:考试成绩的边际分布为:

  • 71-80: 22
  • 81-90: 22
  • 91-100: 20

问题:学习时间(数量)的边际分布是怎样的?

答案:学习时数的边际分布为:

  • 1小时: 14
  • 2小时: 14
  • 3小时: 16
  • 4小时: 20

请注意,边际分布的总数与表中 64 名学生的总数相匹配。

其他资源

描述性或推论性统计
定性和定量变量
测量级别:名义、序数、间隔和比率

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注