方差分析 (anova)

本文解释了统计学中的方差分析(也称为方差分析)。因此,您将了解如何进行方差分析、方差分析表是什么以及逐步解决的练习。此外,它还显示了执行方差分析时必须遵守的先验假设,以及方差分析的优点和缺点。

什么是方差分析 (ANOVA)?

在统计学中,方差分析,也称为ANOVA (方差分析),是一种允许您比较不同样本均值之间方差的技术。

方差分析(ANOVA)用于分析两个以上总体的均值之间是否存在差异。因此,方差分析使我们能够通过分析样本均值之间的变异性来确定两个或多个组的总体均值是否不同。

因此,方差分析的零假设是所有分析组的均值相等。而备择假设则认为至少有一种手段是不同的。

\begin{cases}H_0: \mu_1=\mu_2=\ldots=\mu_k=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=1,2,\ldots, k\end{cases}

因此,方差分析对于比较两个以上组的均值特别有用,因为通过这种类型的分析,您可以同时研究所有组的均值,而不是成对比较均值。下面我们将了解方差分析的优点和缺点。

方差分析表

方差分析总结在一个称为方差分析表的表中,其公式如下:

方差分析或方差分析公式

金子:

  • n_i

    是样本大小 i。

  • N

    是观测值的总数。

  • k

    是方差分析中不同组的数量。

  • y_{ij}

    是组 i 的值 j。

  • \overline{y}_{i}

    是第 i 组的平均值。

  • \overline{y}

    这是所有分析数据的平均值。

方差分析 (ANOVA) 示例

为了理解方差分析的概念,让我们通过逐步求解示例来了解如何进行方差分析。

  • 进行统计研究以比较四名学生在三个不同科目(A、B 和 C)中获得的分数。下表详细列出了每个学生在最高分为 20 分的测试中获得的分数。执行方差分析以比较每个学生在每个科目中获得的分数。

此方差分析的零假设是三个受试者的分数均值相等。另一方面,零假设是其中一些均值不同。

\begin{cases}H_0: \mu_A=\mu_B=\mu_C=\mu\\[2ex]H_1: \exists \mu_i\neq \mu \quad i=A, B, C\end{cases}

要进行方差分析,首先要做的是计算每个受试者的均值和数据的总均值:

\overline{y}_A=\cfrac{14+12+14+10}{4}=12,5

\overline{y}_B=\cfrac{13+14+10+14}{4}=12,75

\overline{y}_C=\cfrac{19+17+16+19}{4}=17,75

\overline{y}=\cfrac{14+12+14+10+13+14+10+14+19+17+16+19}{12}=14,33

一旦我们知道了均值,我们就可以使用上面看到的方差分析 (ANOVA) 公式来计算平方和:

\begin{aligned}\displaystyle SS_F&=\sum_{i=1}^k n_i(\overline{y}_i-\overline{y})^2\\[2ex] SS_F&= 4\cdot (12,5-14,33)^2+4\cdot (12,75-14,33)^2+4\cdot (17,75-14,33)^2\\[2ex] SS_F&=70,17\end{aligned}

\begin{aligned}\displaystyle SS_E=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y}_i)^2\\[2ex] \displaystyle SS_E=\ &(14-12,5)^2+(12-12,5)^2+(14-12,5)^2+(10-12,5)^2+\\&+(13-12,75)^2+(14-12,75)^2+(10-12,75)^2+(14-12,75)^2+\\&+(19-17,75)^2+(17-17,75)^2+(16-17,75)^2+(19-17,75)^2\\[2ex] SS_E=\ &28,50\end{aligned}

\begin{aligned}\displaystyle SS_T=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y})^2\\[2ex] \displaystyle SS_T= \ &(14-14,33)^2+(12-14,33)^2+(14-14,33)^2+(10-14,33)^2+\\&+(13-14,33)^2+(14-14,33)^2+(10-14,33)^2+(14-14,33)^2+\\&+(19-14,33)^2+(17-14,33)^2+(16-14,33)^2+(19-14,33)^2\\[2ex] SS_T= \ &98,67\end{aligned}

然后我们确定因子、误差和总的自由度:

GL_F=k-1=3-1=2

GL_E=N-k=12-3=9

GL_F=N-1=12-1=11

现在,我们通过将因子和误差的平方和除以它们各自的自由度来计算均方误差:

MSE_F=\cfrac{SS_F}{GL_F}=\cfrac{70,17}{2}=35,08

MSE_R=\cfrac{SS_R}{GL_R}=\cfrac{28,50}{9}=3,17

最后,我们通过将上一步计算出的两个误差相除来计算 F 统计量的值:

F=\cfrac{MSE_F}{MSE_R}=\cfrac{35,09}{3,17}=11,08

简而言之,示例数据的方差分析表如下所示:

方差分析 (ANOVA) 示例

一旦计算完方差分析表中的所有值,剩下的就是解释获得的结果。为此,我们需要找到在具有相应自由度的 Snedecor F 分布中获得大于 F 统计量的值的概率,即我们需要确定检验的 p 值:

P[F>11,08]=0,004″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”172″ style=”vertical-align: -5px;”></p>
</p>
<p>因此,如果我们采用显着性水平 α=0.05(最常见),我们必须拒绝原假设并接受备择假设,因为检验的 p 值低于显着性水平。这意味着所研究的群体至少有一些手段与其他群体不同。</p>
</p>
<p class=0,004 < 0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \text{Se rechaza } H_0

应该指出的是,目前有几种计算机程序可以在短短几秒钟内执行方差分析。然而,了解计算背后的理论也很重要。

方差分析 (ANOVA) 的假设

为了执行方差分析 (ANOVA),必须满足以下条件:

  • 独立性:观测值相互独立。确保观察独立性的一种方法是在抽样过程中增加随机性。
  • 同方差性:方差必须具有同质性,即残差的变异性是恒定的。
  • 正态性:残差应该呈正态分布,或者换句话说,它们应该服从正态分布。
  • 连续性:因变量必须是连续的。

方差分析 (ANOVA) 的类型

方差分析 (ANOVA) 分为三种类型

  • 单向方差分析(one-way ANOVA) :方差分析中只有一个因素,即只有一个自变量。
  • 双向方差分析(two-way ANOVA) :方差分析有两个因素,因此分析两个自变量以及它们之间的交互作用。
  • 多元方差分析(MANOVA) :在方差分析中,存在多个因变量。目标是确定当因变量变化时自变量的值是否改变。

方差分析 (ANOVA) 的优点和缺点

最后,我们将了解何时适合使用方差分析,以及此类统计分析的局限性。

方差分析 (ANOVA) 的主要优点是它允许同时比较两个以上的组。与只能分析一两个样本的均值的t 检验不同,方差分析用于确定多个总体是否具有相同的均值。

然而,方差分析并不能告诉我们哪个研究组具有不同的均值,它只能让我们知道是否存在显着差异的均值或所有均值是否相似。

同样,方差分析的另一个缺点是必须满足前面的四个假设(见上文)才能进行方差分析,否则得出的结论可能是错误的。因此,应始终验证统计数据集是否满足这四个要求。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注