如何在 spss 中测试多重共线性
当两个或多个预测变量彼此高度相关时,就会出现回归分析中的 多重共线性,以致它们不会在回归模型中提供唯一或独立的信息。如果变量之间的相关程度足够高,则在拟合和解释回归模型时可能会出现问题。
检测多重共线性的一种方法是使用称为方差膨胀因子 (VIF) 的指标,该指标衡量回归模型中预测变量之间的相关性和相关强度。
本教程介绍如何使用 VIF 检测 SPSS 回归分析中的多重共线性。
示例:SPSS 中的多重共线性
假设我们有以下数据集,显示 10 名学生的考试成绩以及他们学习的小时数、参加的模拟考试次数以及他们在课程中的当前成绩:
我们希望使用Score作为响应变量,使用hours 、 prep_exams和current_grade作为预测变量来执行线性回归,但我们希望确保这三个预测变量不是高度相关的。
为了确定多重共线性是否是一个问题,我们可以为每个预测变量生成 VIF 值。
为此,请依次单击“分析”选项卡、 “回归” 、 “线性” :
在出现的新窗口中,将分数拖到标记为“Dependent”的框中,并将三个预测变量拖动到标记为“Independent(s)”的框中。然后单击“统计”并确保选中“共线性诊断”旁边的框。然后单击“继续” 。然后单击“确定” 。
单击“确定”后,将出现下表,显示每个预测变量的 VIF 值:
每个预测变量的VIF值如下:
- 小时: 1,169
- 准备考试: 1,403
- 当前分数: 1.522
VIF 值从 1 开始,没有上限。解释 VIF 的一般规则是:
- 值 1 表示给定预测变量与模型中的任何其他预测变量之间不存在相关性。
- 1 到 5 之间的值表示给定预测变量与模型中的其他预测变量之间存在中等相关性,但通常没有严重到需要特别注意的程度。
- 大于 5 的值表示给定预测变量与模型中的其他预测变量之间存在潜在的严重相关性。在这种情况下,回归结果中的系数估计和 p 值可能不可靠。
我们可以看到,本例中预测变量的 VIF 值都不大于 5,这表明多重共线性不会成为回归模型中的问题。