R の回帰モデル出力の pr(>|t|) を解釈する方法
R で線形回帰を実行すると、回帰モデルの出力が次の形式で表示されます。
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
Pr(>|t|)列は、 t 値列の値に関連付けられた p 値を表します。
p 値が特定の有意レベル (例: α = 0.05) を下回る場合、予測変数はモデル内の応答変数と統計的に有意な関係があると見なされます。
次の例は、特定の回帰モデルの Pr(>|t|) 列の値を解釈する方法を示しています。
例: Pr(>|t|) 値を解釈する方法
予測子変数x1およびx2と単一の応答変数yを使用して重線形回帰モデルを近似したいとします。
次のコードは、データ フレームを作成し、回帰モデルをデータに適合させる方法を示しています。
#create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
x2=c(7, 7, 5, 6, 5, 4, 5, 6),
y=c(8, 8, 9, 9, 13, 14, 17, 14))
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)
#view model summary
summary(model)
Call:
lm(formula = y ~ x1 + x2, data = df)
Residuals:
1 2 3 4 5 6 7 8
2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208
Pr(>|t|) 列の値を解釈する方法は次のとおりです。
- 予測子変数 x1 の p 値は0.0325です。この値は 0.05 未満であるため、モデル内の応答変数と統計的に有意な関係があります。
- 予測子変数 x2 の p 値は0.3732です。この値は 0.05 以上であるため、モデル内の応答変数と統計的に有意な関係はありません。
係数テーブルの下の有意性コードは、 p 値 0.0325 の隣にある 1 つのアスタリスク (*) が、p 値が α = 0.05 で統計的に有意であることを意味していることを示しています。
Pr(>|t|) は実際にどのように計算されるのでしょうか?
Pr(>|t|) の値が実際に計算される方法は次のとおりです。
ステップ 1: t 値を計算する
まず、次の式を使用してt 値を計算します。
- t 値= 推定値 / 標準値エラー
たとえば、予測子変数 x1 の t 値を計算する方法は次のとおりです。
#calculate t-value
1.4758 / .5029
[1] 2.934579
ステップ 2: p 値を計算する
次に、p 値を計算します。これは、t 分布の絶対値が 2.935 より大きい確率を表します。
R で次の式を使用して、この値を計算できます。
- p 値= 2 * pt (abs (t 値)、残差 df、 lower.tail = FALSE)
たとえば、残りの自由度が 5 である t 値 2.935 の p 値を計算する方法は次のとおりです。
#calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )
[1] 0.0324441
この p 値は、上記の回帰出力の p 値と一致することに注意してください。
注:残留自由度の値は回帰出力の下部にあります。この例では、5 であることがわかりました。
Residual standard error: 1.867 on 5 degrees of freedom