如何在 spss 中执行多元线性回归
多元线性回归是一种我们可以用来理解两个或多个解释变量与响应变量之间关系的方法。
本教程介绍如何在 SPSS 中执行多元线性回归。
示例:SPSS 中的多元线性回归
假设我们想知道学习的小时数和参加练习考试的次数是否会影响学生在给定考试中获得的成绩。为了探索这一点,我们可以使用以下变量执行多元线性回归:
解释变量:
- 学习时间
- 预备考试已通过
响应变量:
- 考试成绩
使用以下步骤在 SPSS 中执行此多元线性回归。
第 1 步:输入数据。
输入 20 名学生的学习时数、参加的预备考试和收到的考试结果的以下数据:
步骤 2:执行多元线性回归。
单击“分析”选项卡,然后单击“回归” ,然后单击“线性” :
将变量分数拖到标记为“Dependent”的框中。将hours和prep_exams变量拖到标记为 Independent(s) 的框中。然后单击“确定” 。
步骤 3:解释结果。
单击“确定”后,多元线性回归结果将显示在新窗口中。
我们感兴趣的第一个表称为模型摘要:
以下是如何解释此表中最相关的数字:
- R 方:这是可以由解释变量解释的响应变量方差的比例。在此示例中, 73.4%的考试成绩差异可以通过学习时间和参加准备考试的次数来解释。
- 标准。估计误差:标准误差是观测值与回归线之间的平均距离。在此示例中,观测值与回归线平均偏差5.3657个单位。
我们感兴趣的下一个表称为方差分析:
以下是如何解释此表中最相关的数字:
- F:这是回归模型的总体 F 统计量,计算方式为均方回归/均方残差。
- Sig:这是与总体 F 统计量相关的 p 值。这告诉我们回归模型作为一个整体是否具有统计显着性。换句话说,它告诉我们两个解释变量的组合是否与响应变量具有统计上显着的关联。在这种情况下,p 值等于 0.000,这表明解释变量、学习时间和参加的准备考试与考试结果具有统计显着相关性。
我们感兴趣的下表的标题是“系数” :
以下是如何解释此表中最相关的数字:
- B 非标准化(常数):这告诉我们当两个预测变量均为零时响应变量的平均值。在此示例中,当学习时间和准备考试均为零时,平均考试成绩为67,674 。
- 非标准化 B(小时):假设参加的预备考试数量保持不变,这告诉我们与学习时间增加一学分相关的考试成绩的平均变化。在这种情况下,假设练习考试的数量保持不变,每多花一个小时学习,考试成绩就会增加5,556分。
- 非标准化 B (prep_exams):这告诉我们,假设学习时数保持不变,则与所参加的预科考试增加一个单位相关的考试分数的平均变化。在这种情况下,假设学习时数保持不变,每多参加一次预备考试,考试成绩就会下降0.602分。
- 签名。 (小时):这是解释变量hours的 p 值。由于该值 (0.000) 小于 0.05,因此我们可以得出结论,学习时间与考试成绩具有统计显着相关性。
- 签名。 (prep_exams):这是prep_exams解释变量的 p 值。由于该值 (0.519) 不小于 0.05,因此我们不能得出结论,参加预科考试的次数与考试成绩存在统计上显着的关联。
最后,我们可以使用表中所示的常数、小时数和prep_exams的值形成回归方程。在这种情况下,方程为:
预计考试成绩 = 67.674 + 5.556*(小时) – 0.602*(prep_exams)
我们可以使用这个方程根据学生的学习小时数和参加的练习考试次数来找到学生的估计考试成绩。例如,学习 3 小时并参加 2 次预备考试的学生应获得 83.1 分的考试成绩:
预计考试成绩 = 67.674 + 5.556*(3) – 0.602*(2) = 83.1
注意:由于未发现预备考试的解释变量具有统计显着性,因此我们可以决定将其从模型中删除,而是使用学习时间作为唯一的解释变量进行简单的线性回归。