同方差性
本文解释了统计学中的同方差性。因此,您将找到同方差性的定义、回归模型不具有同方差性的原因是什么以及如何解决它。
什么是同方差性?
同方差性是回归模型的一个特征,其解释变量的误差具有恒定的方差。也就是说,当回归模型的误差方差一定时,该模型表现出同方差,因此是同方差模型。
请记住,误差(或残差)被定义为实际值与回归模型估计值之间的差异。
运行回归模型时,我们将为每个观察得到与先前表达式不同的值。因此,同方差统计模型是一种计算误差的方差在整个观察过程中保持恒定的模型。
回归模型表现出同方差性非常重要;事实上,这是回归模型之前的假设之一。如果残差不是同方差的,最好以另一种方式重做模型以获得同方差。否则,回归系数的估计可能是错误的,并且由于接受实际上应该被拒绝的零假设,也会在假设检验中出现错误。
缺乏同方差的原因
模型不具有同方差性的最常见原因是:
- 当数据范围与平均值相比非常宽时。如果在同一个统计样本中存在很大的值和很小的值,那么很可能得到的回归模型不是同方差的。
- 在回归模型中省略变量也会导致缺乏同方差性。从逻辑上讲,如果模型中不包含相关变量,则其变化将包含在残差中,并且不一定是固定的。
- 结构的变化可能会导致模型与数据集的拟合较差,因此残差的方差不是恒定的。
- 当某些变量的值远大于其他解释变量的值时,模型可能不具有同方差性。在这种情况下,可以将变量相对化来解决问题。
然而,有些情况本质上很难呈现为同方差性。例如,如果我们用一个人的食品支出来模拟一个人的收入,那么富裕的人的食品支出的变异性比穷人大得多。因为富人有时在昂贵的餐馆吃饭,有时在便宜的餐馆吃饭,不像穷人总是在便宜的餐馆吃饭。因此,回归模型很难实现同方差。
纠正数据以实现同方差
当得到的回归模型不是同方差时,可以尝试以下修正来实现同方差:
- 计算自变量的自然对数,当图中残差方差增大时,这通常很有用。
- 根据残差图,自变量的另一种变换可能更实用。例如,如果图形是抛物线形状,我们可以计算自变量的平方并将该变量添加到模型中。
- 其他变量也可以用于模型;通过删除或添加变量,可以修改残差的方差。
- 可以使用加权最小二乘准则来代替使用最小二乘准则。
同方差和异方差
最后,我们将了解同方差和异方差之间的区别,因为它们是回归模型的两个重要统计概念。
异方差是一种统计特征,意味着回归模型的残差不具有恒定方差,因此整个图中误差的变异性并不相同。
同方差和异方差之间的区别在于误差方差的恒定性。同方差性意味着误差方差是恒定的,而异方差性意味着误差方差不是恒定的。
➤请参阅:异方差