什么是标准变量? (解释+示例)
标准变量只是因变量或响应变量的另一个名称。它是统计分析中预测的变量。
就像解释变量有不同的名称(如预测变量或自变量)一样,响应变量也有可互换的名称,如因变量或标准变量。
标准变量有哪些示例?
以下场景说明了几种不同上下文中标准变量的示例。
示例 1:简单线性回归
简单线性回归是我们用来理解两个变量 x 和 y 之间关系的统计方法。变量 x 称为预测变量。另一个变量 y 称为标准变量或响应变量。
在简单线性回归中,我们找到一条描述预测变量和标准变量之间关系的“最佳拟合线”。
例如,我们可以使用学习时间作为预测变量、测试分数作为标准变量,将简单的线性回归模型拟合到数据集。在这种情况下,我们将使用简单线性回归来尝试预测标准变量test Score的值。
或者,再举一个例子,我们可以使用权重将简单的线性回归模型拟合到数据集,以预测一群人的规模值。在这种情况下,我们的标准变量是高度,因为这是我们想要预测的值。
如果我们在散点图上绘制身高和体重值,则标准变量height将位于 y 轴上:
一般来说,当我们创建散点图时,标准变量将沿着 y 轴,而预测变量将沿着 x 轴。
示例 2:多元线性回归
多元线性回归与简单线性回归类似,不同之处在于我们使用多个预测变量来预测标准变量的值。
例如,我们可以使用预测变量学习时间和测试前一天晚上睡眠时间来预测标准变量的测试分数值。在这种情况下,我们的标准变量是本次分析中预测的变量。
示例 3:方差分析
ANOVA (方差分析)是一种统计技术,我们用来确定三个或更多独立组的平均值之间是否存在统计显着差异。
例如,我们可能想确定三种不同的锻炼计划是否对减肥有不同的影响。我们研究的预测变量是锻炼计划,有三个水平。
标准变量是体重减轻,以磅为单位。我们可以进行 单向方差分析,以确定这三个计划所带来的体重减轻是否存在统计上的显着差异。
在这种情况下,我们想要了解三个锻炼计划之间的减肥标准变量值是否不同。
如果我们分析锻炼计划和每晚平均睡眠时间,我们将进行双向方差分析,因为我们想了解两个因素如何影响减肥。
但同样,我们的标准变量仍然是体重减轻,因为我们感兴趣的是这个变量的值在不同的运动和睡眠水平上有何不同。
延伸阅读:标准有效性的简单解释