Як інтерпретувати pr(>|t|) у вихідних даних регресійної моделі в r


Щоразу, коли ви виконуєте лінійну регресію в R, вихід вашої моделі регресії відображатиметься в такому форматі:

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732 

Стовпець Pr(>|t|) представляє значення p, пов’язане зі значенням у стовпці значення t .

Якщо p-значення нижче певного рівня значущості (наприклад, α = 0,05), тоді вважається, що прогностична змінна має статистично значущий зв’язок зі змінною відповіді в моделі.

У наступному прикладі показано, як інтерпретувати значення в стовпці Pr(>|t|) для заданої моделі регресії.

Приклад: як інтерпретувати значення Pr(>|t|).

Припустімо, ми хочемо підібрати множинну лінійну регресійну модель , використовуючи змінні-прогнози x1 і x2 і одну змінну відповіді y .

У наведеному нижче коді показано, як створити фрейм даних і підібрати регресійну модель до даних:

 #create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

Ось як інтерпретувати значення в стовпці Pr(>|t|):

  • P-значення для змінної предиктора x1 становить 0,0325 . Оскільки це значення менше 0,05, існує статистично значущий зв’язок зі змінною відповіді в моделі.
  • P-значення для змінної предиктора x2 становить 0,3732 . Оскільки це значення не менше 0,05, воно не має статистично значущого зв’язку зі змінною відповіді в моделі.

Коди значущості під таблицею коефіцієнтів говорять нам, що одна зірочка (*) поруч із значенням p 0,0325 означає, що значення p є статистично значущим при α = 0,05.

Як насправді обчислюється Pr(>|t|)?

Ось як фактично обчислюється значення Pr(>|t|):

Крок 1: обчисліть t-значення

Спочатку ми обчислюємо значення t за такою формулою:

  • t-значення = Оцінка / Стандарт. Помилка

Наприклад, ось як обчислити значення t для змінної предиктора x1:

 #calculate t-value
1.4758 / .5029

[1] 2.934579

Крок 2: Обчисліть p-значення

Далі ми обчислюємо p-value. Це означає ймовірність того, що абсолютне значення розподілу t перевищує 2,935.

Ми можемо використати таку формулу в R, щоб обчислити це значення:

  • p-value = 2 * pt (abs (t-value), залишкова df, bottom.tail = FALSE)

Наприклад, ось як обчислити p-значення для t-значення 2,935 із 5 залишковими ступенями свободи:

 #calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

Зауважте, що це p-значення збігається з p-значенням у вихідних даних регресії вище.

Примітка. Значення залишкових ступенів свободи знаходиться в нижній частині результату регресії. У нашому прикладі вийшло 5:

 Residual standard error: 1.867 on 5 degrees of freedom

Додаткові ресурси

Як виконати просту лінійну регресію в R
Як виконати множинну лінійну регресію в R
Як побудувати результати множинної лінійної регресії в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *