如何在 spss 中创建和解释箱线图


箱线图用于可视化数据集的五位数摘要,其中包括:

  • 最低限度
  • 第一个四分位数
  • 中位数
  • 第三个四分位数
  • 最大值

本教程介绍如何在 SPSS 中创建和编辑箱线图。

如何在 SPSS 中创建单箱图

假设我们有以下数据集,显示某支球队 16 名篮球运动员每场比赛的平均得分:

要创建箱线图来可视化这些数据值的分布,我们可以单击“分析”选项卡,然后单击“描述性统计” ,然后单击“探索”

这将弹出以下窗口:

要创建箱线图,请将变量拖到标记为Dependent List 的区域中。然后确保在框底部显示的选项下选择“绘图”

单击“确定”后,将出现以下箱线图:

SPSS 中的箱线图

以下是如何解释此箱线图:

解释 SPSS 中的箱线图

关于异常值的注释

四分位数间距 (IQR) 是第三个四分位数和第一个四分位数之间的距离。如果任何数据值高于第三个四分位数 IQR 的 1.5 倍或低于第一个四分位数 IQR 的 1.5 倍,则 SPSS 会认为该数据值是离群值。

异常值在 SPSS 中显示为小圆圈。在前面的示例中,没有异常值,这就是箱线图中没有显示小圆圈的原因。但是,如果数据集中的最大值实际上是 50,则箱线图将显示一个小圆圈来指示异常值:

SPSS 中的箱线图异常值

如果您的数据集中存在异常值,您有多种选择:

  • 确保异常值不是数据输入错误。有时,数据值只是被错误记录。如果存在异常值,请首先验证输入的值是否正确并且没有错误。
  • 为异常值指定一个新值。如果异常值是数据输入错误的结果,您可以决定为其分配一个新值,例如数据集的平均值或中位数
  • 删除异常值。如果该值确实是异常值,并且会对您的整体分析产生重大影响,则您可以选择将其删除。请务必在最终报告或分析中提及您删除了异常值。

如何在 SPSS 中创建多个箱线图

如果您有多个变量,SPSS 还可以并排创建多个箱线图。例如,假设我们有来自三个不同球队的 16 名球员的平均得分数据如下:

要为每个变量创建箱线图,我们可以再次单击“分析”选项卡,然后单击“描述性统计” ,然后单击“探索” 。然后我们可以将三个变量拖到标记为Dependent List 的区域中:

单击“确定”后,将出现以下箱线图:

SPSS 中的多个箱线图

这有助于我们轻松地可视化这三个团队之间的分布差异。

我们还可以观察到以下几点:

  • B 队每场比赛的平均得分最高,C 队最低。
  • B 队每场比赛的得分变化最大,这可以通过与 A 队和 C 队相比的箱线图长度来证明。
  • 每场比赛得分最高的球员属于 B 队,每场比赛得分最少的球员属于 C 队。

箱线图很有用,因为它们可以从单个图形中为我们提供有关数据集分布的大量信息。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注