分散分析テーブル

この記事では、ANOVA 表について説明します。そこで、ANOVA 表とは何か、ANOVA 表の作成方法、ANOVA 表の公式とは何かを説明し、さらに、演習を段階的に解くことができます。

ANOVA 表とは何ですか?

ANOVA 表は、分散分析における統計で使用される表です。より具体的には、ANOVA 表には分散分析に必要なすべての情報が含まれています。

したがって、ANOVA 表は分散分析を要約するために使用されます。分散分析の計算を表にプロットすると、結論を簡単に導き出すことができ、ANOVA 検定統計量の値を迅速に計算することもできます。

ANOVA 表の式

一元配置分散分析テーブルには、因子、誤差、合計の 3 つの行があります。したがって、ANOVA テーブルでは、各行の二乗和とその自由度が計算されます。さらに、因子と誤差の平均二乗誤差が計算され、最後に二乗誤差の比に等しい ANOVA 検定統計量が決定されます。

したがって、 ANOVA 表の式は次のようになります。

ANOVA 表の式

金:

  • n_i

    はサンプルサイズ i です。

  • N

    観測値の合計数です。

  • k

    分散分析における異なるグループの数です。

  • y_{ij}

    はグループ i の値 j です。

  • \overline{y}_{i}

    はグループ i の平均です。

  • \overline{y}

    これは、すべての分析データの平均です。

分散分析テーブルの例

概念をよく理解するために、例を段階的に解決して分散分析表を作成する方法を見てみましょう。

  • 3 つの異なる科目 (A、B、C) で 4 人の学生が取得したスコアを比較する統計調査が実行されます。次の表は、最大スコアが 20 であるテストで各生徒が取得したスコアの詳細を示しています。ANOVA テーブルを作成して、各科目で各生徒が取得したスコアを比較します。

最初に行う必要があるのは、各被験者の平均とデータの合計平均を計算することです。

\overline{y}_A=\cfrac{14+12+14+10}{4}=12,5

\overline{y}_B=\cfrac{13+14+10+14}{4}=12,75

\overline{y}_C=\cfrac{19+17+16+19}{4}=17,75

\overline{y}=\cfrac{14+12+14+10+13+14+10+14+19+17+16+19}{12}=14,33

平均値がわかったら、ANOVA 表の式を使用して平方和を計算します (上記を参照)。

\begin{aligned}\displaystyle SS_F&=\sum_{i=1}^k n_i(\overline{y}_i-\overline{y})^2\\[2ex] SS_F&= 4\cdot (12,5-14,33)^2+4\cdot (12,75-14,33)^2+4\cdot (17,75-14,33)^2\\[2ex] SS_F&=70,17\end{aligned}

\begin{aligned}\displaystyle SS_E=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y}_i)^2\\[2ex] \displaystyle SS_E=\ &(14-12,5)^2+(12-12,5)^2+(14-12,5)^2+(10-12,5)^2+\\&+(13-12,75)^2+(14-12,75)^2+(10-12,75)^2+(14-12,75)^2+\\&+(19-17,75)^2+(17-17,75)^2+(16-17,75)^2+(19-17,75)^2\\[2ex] SS_E=\ &28,50\end{aligned}

\begin{aligned}\displaystyle SS_T=&\sum_{i=1}^k\sum_{j=1}^{n_i} (y_{ij}-\overline{y})^2\\[2ex] \displaystyle SS_T= \ &(14-14,33)^2+(12-14,33)^2+(14-14,33)^2+(10-14,33)^2+\\&+(13-14,33)^2+(14-14,33)^2+(10-14,33)^2+(14-14,33)^2+\\&+(19-14,33)^2+(17-14,33)^2+(16-14,33)^2+(19-14,33)^2\\[2ex] SS_T= \ &98,67\end{aligned}

次に、因子、誤差、合計の自由度を決定します。

GL_F=k-1=3-1=2

GL_E=N-k=12-3=9

GL_F=N-1=12-1=11

ここで、因子と誤差の二乗和をそれぞれの自由度で割ることにより、平均二乗誤差を計算します。

MSE_F=\cfrac{SS_F}{GL_F}=\cfrac{70,17}{2}=35,08

MSE_R=\cfrac{SS_R}{GL_R}=\cfrac{28,50}{9}=3,17

最後に、前のステップで計算された 2 つの誤差を除算して、F 統計量の値を計算します。

F=\cfrac{MSE_F}{MSE_R}=\cfrac{35,09}{3,17}=11,08

つまり、サンプル データの ANOVA テーブルは次のようになります。

分散分析テーブルの例

ANOVA 表内のすべての値が計算されたら、あとはそれを解釈するだけです。これを行うには、p 値と呼ばれる F 統計量の値に対応する確率を比較する必要があります。次のリンクをクリックすると、これがどのように行われるかを確認できます。

参照: p値の解釈

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です