Come interpretare pr(>|t|) nell'output del modello di regressione in r
Ogni volta che esegui una regressione lineare in R, l’output del tuo modello di regressione verrà visualizzato nel seguente formato:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
La colonna Pr(>|t|) rappresenta il valore p associato al valore nella colonna del valore t .
Se il valore p è inferiore a un certo livello di significatività (ad esempio α = 0,05), si ritiene che la variabile predittore abbia una relazione statisticamente significativa con la variabile di risposta nel modello.
L’esempio seguente mostra come interpretare i valori nella colonna Pr(>|t|) per un determinato modello di regressione.
Esempio: come interpretare i valori Pr(>|t|).
Supponiamo di voler adattare un modello di regressione lineare multipla utilizzando le variabili predittive x1 e x2 e una singola variabile di risposta y .
Il codice seguente mostra come creare un frame di dati e adattare un modello di regressione ai dati:
#create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
x2=c(7, 7, 5, 6, 5, 4, 5, 6),
y=c(8, 8, 9, 9, 13, 14, 17, 14))
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)
#view model summary
summary(model)
Call:
lm(formula = y ~ x1 + x2, data = df)
Residuals:
1 2 3 4 5 6 7 8
2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.0035 5.9091 1.693 0.1513
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208
Ecco come interpretare i valori nella colonna Pr(>|t|):
- Il valore p per la variabile predittrice x1 è 0,0325 . Poiché questo valore è inferiore a 0,05, esiste una relazione statisticamente significativa con la variabile di risposta nel modello.
- Il valore p per la variabile predittrice x2 è 0,3732 . Poiché questo valore non è inferiore a 0,05, non ha una relazione statisticamente significativa con la variabile di risposta nel modello.
I codici di significatività sotto la tabella dei coefficienti ci dicono che un singolo asterisco (*) accanto al valore p di 0,0325 significa che il valore p è statisticamente significativo a α = 0,05.
Come viene effettivamente calcolato Pr(>|t|)?
Ecco come viene effettivamente calcolato il valore di Pr(>|t|):
Passaggio 1: calcolare il valore t
Innanzitutto, calcoliamo il valore t utilizzando la seguente formula:
- valore t = stima / std. Errore
Ad esempio, ecco come calcolare il valore t per la variabile predittrice x1:
#calculate t-value
1.4758 / .5029
[1] 2.934579
Passaggio 2: calcolare il valore p
Successivamente, calcoliamo il valore p. Ciò rappresenta la probabilità che il valore assoluto della distribuzione t sia maggiore di 2,935.
Possiamo usare la seguente formula in R per calcolare questo valore:
- valore p = 2 * pt (abs (valore t), df residuo, coda inferiore = FALSO)
Ad esempio, ecco come calcolare il valore p per un valore t di 2,935 con 5 gradi di libertà residui:
#calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )
[1] 0.0324441
Si noti che questo valore p corrisponde al valore p nell’output della regressione sopra.
Nota: il valore dei gradi di libertà residui si trova nella parte inferiore dell’output della regressione. Nel nostro esempio, risulta essere 5:
Residual standard error: 1.867 on 5 degrees of freedom
Risorse addizionali
Come eseguire una regressione lineare semplice in R
Come eseguire la regressione lineare multipla in R
Come tracciare i risultati di regressione lineare multipla in R