Як інтерпретувати pr(>|t|) у вихідних даних регресійної моделі в r
Щоразу, коли ви виконуєте лінійну регресію в R, вихід вашої моделі регресії відображатиметься в такому форматі:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
Стовпець Pr(>|t|) представляє значення p, пов’язане зі значенням у стовпці значення t .
Якщо p-значення нижче певного рівня значущості (наприклад, α = 0,05), тоді вважається, що прогностична змінна має статистично значущий зв’язок зі змінною відповіді в моделі.
У наступному прикладі показано, як інтерпретувати значення в стовпці Pr(>|t|) для заданої моделі регресії.
Приклад: як інтерпретувати значення Pr(>|t|).
Припустімо, ми хочемо підібрати множинну лінійну регресійну модель , використовуючи змінні-прогнози x1 і x2 і одну змінну відповіді y .
У наведеному нижче коді показано, як створити фрейм даних і підібрати регресійну модель до даних:
#create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
x2=c(7, 7, 5, 6, 5, 4, 5, 6),
y=c(8, 8, 9, 9, 13, 14, 17, 14))
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)
#view model summary
summary(model)
Call:
lm(formula = y ~ x1 + x2, data = df)
Residuals:
1 2 3 4 5 6 7 8
2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208
Ось як інтерпретувати значення в стовпці Pr(>|t|):
- P-значення для змінної предиктора x1 становить 0,0325 . Оскільки це значення менше 0,05, існує статистично значущий зв’язок зі змінною відповіді в моделі.
- P-значення для змінної предиктора x2 становить 0,3732 . Оскільки це значення не менше 0,05, воно не має статистично значущого зв’язку зі змінною відповіді в моделі.
Коди значущості під таблицею коефіцієнтів говорять нам, що одна зірочка (*) поруч із значенням p 0,0325 означає, що значення p є статистично значущим при α = 0,05.
Як насправді обчислюється Pr(>|t|)?
Ось як фактично обчислюється значення Pr(>|t|):
Крок 1: обчисліть t-значення
Спочатку ми обчислюємо значення t за такою формулою:
- t-значення = Оцінка / Стандарт. Помилка
Наприклад, ось як обчислити значення t для змінної предиктора x1:
#calculate t-value
1.4758 / .5029
[1] 2.934579
Крок 2: Обчисліть p-значення
Далі ми обчислюємо p-value. Це означає ймовірність того, що абсолютне значення розподілу t перевищує 2,935.
Ми можемо використати таку формулу в R, щоб обчислити це значення:
- p-value = 2 * pt (abs (t-value), залишкова df, bottom.tail = FALSE)
Наприклад, ось як обчислити p-значення для t-значення 2,935 із 5 залишковими ступенями свободи:
#calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )
[1] 0.0324441
Зауважте, що це p-значення збігається з p-значенням у вихідних даних регресії вище.
Примітка. Значення залишкових ступенів свободи знаходиться в нижній частині результату регресії. У нашому прикладі вийшло 5:
Residual standard error: 1.867 on 5 degrees of freedom
Додаткові ресурси
Як виконати просту лінійну регресію в R
Як виконати множинну лінійну регресію в R
Як побудувати результати множинної лінійної регресії в R