内插法或外推法:有什么区别?
学生在统计学中经常混淆的两个术语是插值和外推。
区别如下:
插值是指预测落在一定数据点范围内的值。
外推法是指预测超出数据点范围的值。
以下示例说明了这两个术语之间的区别。
示例:插值和外推
假设我们有以下数据集:
我们可以决定对这些点拟合一个简单的线性回归模型:
然后,我们可以使用拟合的回归模型来预测数据点范围内部和外部的点值。
当我们使用拟合的回归模型来预测现有数据点范围内的点值时,称为插值。
相反,当我们使用拟合回归模型来预测现有范围之外的点值时,称为外推法:
外推法的潜在危险
当我们进行推断时,我们假设当前数据点范围内存在的相同模式也存在于该范围之外。
然而,这可能是一个危险的假设,因为当前数据点范围之外存在的模式可能非常不同:
因此,使用外推法来预测超出用于创建回归模型的值范围的数据点值可能很危险。
在实践中,使用外推法来预测稍微超出现有值范围的点值通常是有意义的,但偏离范围越远,预测值与实际值之间的差异就越大。价值很重要。 。
何时使用外推法
通常需要特定领域的专业知识来确定外推法是否合理。
例如,假设公司的营销部门应用简单的线性回归模型,使用广告支出作为预测变量,总收入作为响应变量。
在这种情况下,可以合理地假设广告支出的稳定增长将导致总收入的可预测增长:
在这种情况下,我们可以对自己推断值的能力充满信心。
然而,考虑这样一个场景:生物学家想要使用总肥料来预测植物生长。
她可能决定对数据点拟合一个简单的线性回归模型,但由于植物高度存在上限,因此使用外推法来预测点值可能没有意义。超出取值范围。用于拟合模型的值:
在这种情况下,我们可能对自己推断价值的能力缺乏信心。
结论:外推法在某些地区可能比其他地区更有意义,但始终存在潜在的危险,即用于拟合模型的值范围内存在的模型在海滩之外并不存在。