一元配置分散分析を手動で実行する方法
一元配置 ANOVA (「分散分析」) は、3 つ以上の独立したグループの平均を比較し、対応する母集団の平均間に統計的に有意な差があるかどうかを判断します。
このチュートリアルでは、一元配置分散分析を手動で実行する方法について説明します。
例: 手動による一元配置分散分析
3 つの異なる試験準備プログラムが、特定の試験で異なる平均点につながるかどうかを知りたいとします。これをテストするために、研究に参加する 30 人の学生を募集し、3 つのグループに分けます。
各グループの学生は、次の 3 週間、3 つの試験準備プログラムのうち 1 つを使用して試験の準備をするようにランダムに割り当てられます。 3 週間の終わりに、生徒全員が同じ試験を受けます。
各グループの試験結果は以下のとおりです。
次の手順に従って、一元配置分散分析を手動で実行し、試験の平均スコアが 3 つのグループ間で異なるかどうかを判断します。
ステップ 1: グループ平均と全体平均を計算します。
まず、3 つのグループの平均と全体の平均を計算します。
ステップ 2: SSR を計算します。
次に、次の式を使用して二乗和回帰 (SSR) を計算します。
nΣ(X j – X ..) 2
金:
- n : グループ j のサンプルサイズ
- Σ : 「和」を意味するギリシャ語の記号
- X j : グループ j の平均
- X .. : 全体の平均
この例では、SSR = 10(83.4-85.8) 2 + 10(89.3-85.8) 2 + 10(84.7-85.8) 2 = 192.2と計算されます。
ステップ 3: SES を計算します。
次に、次の式を使用して二乗誤差和 (SSE) を計算します。
Σ(X ij – X j ) 2
金:
- Σ : 「和」を意味するギリシャ語の記号
- X ij : グループ j のi 番目の観測値
- X j : グループ j の平均
この例では、SSE を次のように計算します。
グループ 1: (85-83.4) 2 + (86-83.4) 2 + (88-83.4) 2 + (75-83.4) 2 + (78-83.4) 2 + (94-83.4) 2 + (98-83.4) 2 + (79-83.4) 2 + (71-83.4) 2 + (80-83.4) 2 = 640.4
グループ 2: (91-89.3) 2 + (92-89.3) 2 + (93-89.3) 2 + (85-89.3) 2 + (87-89.3) 2 + (84-89.3) 2 + (82-89.3) 2 + (88-89.3) 2 + (95-89.3) 2 + (96-89.3) 2 = 208.1
グループ 3: (79-84.7) 2 + (78-84.7) 2 + (88-84.7) 2 + (94-84.7) 2 + (92-84.7) 2 + (85-84.7) 2 + (83-84.7) 2 + (85-84.7) 2 + (82-84.7) 2 + (81-84.7) 2 = 252.1
ESS: 640.4 + 208.1 + 252.1 = 1,100.6
ステップ 4: SST を計算します。
次に、次の式を使用して平方和 (SST) の合計を計算します。
SST = SSR + SSE
この例では、SST = 192.2 + 1100.6 = 1292.8
ステップ 5: ANOVA 表を完成させます。
SSR、SSE、SST が得られたので、ANOVA テーブルに値を入力できます。
ソース | 二乗和 (SS) | DF | 平均二乗 (MS) | F |
---|---|---|---|---|
処理 | 192.2 | 2 | 96.1 | 2,358 |
エラー | 1100.6 | 27 | 40.8 | |
合計 | 1292.8 | 29 |
表内のさまざまな数値を計算する方法は次のとおりです。
- 処理 df: k-1 = 3-1 = 2
- エラー df: nk = 30-3 = 27
- 合計DF: n-1 = 30-1 = 29
- SEP処理: SST処理/df=192.2/2=96.1
- MS エラー: SSE エラー / df = 1100.6 / 27 = 40.8
- F: MS 処理 / MS エラー = 96.1 / 40.8 = 2.358
注: n = 観測値の合計数、k = グループの数
ステップ 6: 結果を解釈します。
この一元配置分散分析の F 検定統計量は2.358です。これが統計的に有意な結果であるかどうかを判断するには、次の値を持つF 分布表にある臨界 F 値と比較する必要があります。
- α (有意水準) = 0.05
- DF1 (分子の自由度) = df 処理 = 2
- DF2 (分母の自由度) = 誤差 df = 27
F の臨界値は3.3541であることがわかります。
ANOVA 表の F 検定統計量は F 分布表の臨界値 F より小さいため、帰無仮説を棄却できません。これは、3 つのグループの平均試験得点の間に統計的に有意な差があると言える十分な証拠がないことを意味します。
ボーナス リソース:この 一元配置分散分析計算ツールを使用して、最大 5 つのサンプルに対して一元配置分散分析を自動的に実行します。