完全ガイド: r で anova 結果を解釈する方法

によるベンジャミン・アンダーソン博士 7月 25, 2023 ガイド 0コメント

一元配置分散分析は、 3 つ以上の独立したグループの平均間に統計的に有意な差があるかどうかを判断するために使用されます。

このチュートリアルでは、R で一元配置分散分析の結果を解釈する方法に関する完全なガイドを提供します。

ステップ 1: データを作成する

3 つの異なるトレーニングプログラムによって個人の平均体重減少が異なるかどうかを判断したいとします。

これをテストするために、実験に参加する 90 人を募集し、30 人をランダムに割り当てて、プログラム A、プログラム B、またはプログラム C のいずれかを 1 か月間実行します。

次のコードは、作業するデータフレームを作成します。

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep(c(' A ', ' B ', ' C '), each = 30),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#view first six rows of data frame
head(data)

program weight_loss
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458

ステップ 2: ANOVA を実行する

次に、 aov()コマンドを使用して一元配置分散分析を実行します。

 #fit one-way ANOVA model
model <- aov(weight_loss ~ program, data = data)

ステップ 3: ANOVA 結果を解釈する

次に、 summary()コマンドを使用して、一元配置分散分析の結果を表示します。

 #view summary of one-way ANOVA model
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)    
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

各結果値を解釈する方法は次のとおりです。

Program Df:変数プログラムの自由度。これは #groups -1 として計算されます。この場合、3 つの異なるトレーニングプログラムがあるため、この値は 3-1 = 2となります。

Df Residuals:残差の自由度。これは、観測総数 – グループ数として計算されます。この場合、90 個の観測値と 3 つのグループがあるため、この値は 90 -3 = 87となります。

Program Sum Sq:変数プログラムに関連付けられた平方和。この値は98.93です。

残差二乗和:残差または「誤差」に関連付けられた二乗和。この値は139.57です。

中くらいの正方形。プログラム:プログラムに関連付けられた平均平方和。これは二乗和として計算されます。プログラム / プログラム Df.この場合、これは次のように計算されます: 98.93 / 2 = 49.46 。

中くらいの正方形。残差:残差に関連付けられた平均二乗和。これは二乗和として計算されます。残基 / 残基 Df.この場合、これは次のように計算されます: 139.57 / 87 = 1.60 。

F 値: ANOVA モデルの全体的な F 統計量。これは二乗平均として計算されます。プログラム / 平均二乗。残留物。この場合、次のように計算されます: 49.46 / 1.60 = 30.83 。

Pr(>F):分子 df = 2、分母 df = 87 の F 統計量に関連付けられた p 値。この場合、p 値は7.552e-11であり、非常に小さい数値です。

一連の結果の中で最も重要な値は p 値です。これにより、3 つのグループ間の平均値に有意な差があるかどうかがわかります。

一元配置分散分析では次の帰無仮説と対立仮説が使用されることを思い出してください。

H ₀ (帰無仮説):すべてのグループ平均は等しい。
H _A (対立仮説):少なくとも 1 つのグループ平均が他のグループ平均とは異なります。

ANOVA テーブルの p 値 (.7552e-11) は 0.05 未満であるため、帰無仮説を棄却する十分な証拠があります。

これは、個人が経験する平均体重減少が 3 つのトレーニングプログラム間で同等ではないと言える十分な証拠があることを意味します。

ステップ 4: 事後テストを実行する (必要な場合)

ANOVA 出力の p 値が 0.05 未満の場合、帰無仮説は棄却されます。これは、各グループ間の平均値が等しくないことを示しています。ただし、これではどのグループが互いに異なるかは分かりません。

それを確認するには、事後テストを実行する必要があります。 R では、 TukeyHSD()関数を使用してこれを行うことができます。

 #perform Tukey post-hoc test
TukeyHSD(model)

$program
         diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199

結果を解釈する方法は次のとおりです。

グループ A とグループ B の間の平均差の調整された p 値は0.0100545です。
グループ A とグループ C の間の平均差の調整された p 値は0.0000000です。
グループ B とグループ C の間の平均差の調整された p 値は0.0000199です。

調整後の各 p 値は 0.05 未満であるため、各グループ間の平均体重減少には有意な差があると結論付けることができます。

追加リソース

一元配置分散分析の概要
 ANOVA の仮定を確認する方法
 一元配置分散分析を手動で実行する方法
 一元配置分散分析計算機

著者について

ベンジャミン・アンダーソン博士

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る