Come interpretare pr(>|t|) nell'output del modello di regressione in r


Ogni volta che esegui una regressione lineare in R, l’output del tuo modello di regressione verrà visualizzato nel seguente formato:

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732 

La colonna Pr(>|t|) rappresenta il valore p associato al valore nella colonna del valore t .

Se il valore p è inferiore a un certo livello di significatività (ad esempio α = 0,05), si ritiene che la variabile predittore abbia una relazione statisticamente significativa con la variabile di risposta nel modello.

L’esempio seguente mostra come interpretare i valori nella colonna Pr(>|t|) per un determinato modello di regressione.

Esempio: come interpretare i valori Pr(>|t|).

Supponiamo di voler adattare un modello di regressione lineare multipla utilizzando le variabili predittive x1 e x2 e una singola variabile di risposta y .

Il codice seguente mostra come creare un frame di dati e adattare un modello di regressione ai dati:

 #create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

Ecco come interpretare i valori nella colonna Pr(>|t|):

  • Il valore p per la variabile predittrice x1 è 0,0325 . Poiché questo valore è inferiore a 0,05, esiste una relazione statisticamente significativa con la variabile di risposta nel modello.
  • Il valore p per la variabile predittrice x2 è 0,3732 . Poiché questo valore non è inferiore a 0,05, non ha una relazione statisticamente significativa con la variabile di risposta nel modello.

I codici di significatività sotto la tabella dei coefficienti ci dicono che un singolo asterisco (*) accanto al valore p di 0,0325 significa che il valore p è statisticamente significativo a α = 0,05.

Come viene effettivamente calcolato Pr(>|t|)?

Ecco come viene effettivamente calcolato il valore di Pr(>|t|):

Passaggio 1: calcolare il valore t

Innanzitutto, calcoliamo il valore t utilizzando la seguente formula:

  • valore t = stima / std. Errore

Ad esempio, ecco come calcolare il valore t per la variabile predittrice x1:

 #calculate t-value
1.4758 / .5029

[1] 2.934579

Passaggio 2: calcolare il valore p

Successivamente, calcoliamo il valore p. Ciò rappresenta la probabilità che il valore assoluto della distribuzione t sia maggiore di 2,935.

Possiamo usare la seguente formula in R per calcolare questo valore:

  • valore p = 2 * pt (abs (valore t), df residuo, coda inferiore = FALSO)

Ad esempio, ecco come calcolare il valore p per un valore t di 2,935 con 5 gradi di libertà residui:

 #calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

Si noti che questo valore p corrisponde al valore p nell’output della regressione sopra.

Nota: il valore dei gradi di libertà residui si trova nella parte inferiore dell’output della regressione. Nel nostro esempio, risulta essere 5:

 Residual standard error: 1.867 on 5 degrees of freedom

Risorse addizionali

Come eseguire una regressione lineare semplice in R
Come eseguire la regressione lineare multipla in R
Come tracciare i risultati di regressione lineare multipla in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *