Come utilizzare la funzione coeftest() in r
È possibile utilizzare la funzione coeftest() del pacchetto lmtest in R per eseguire un test t per ogni coefficiente stimato in un modello di regressione.
Questa funzione utilizza la seguente sintassi di base:
coeftest(x)
Oro:
- x : nome del modello di regressione adattato
L’esempio seguente mostra come utilizzare questa funzione nella pratica.
Esempio: come utilizzare la funzione coeftest() in R
Supponiamo di avere il seguente frame di dati in R che mostra il numero di ore trascorse a studiare, il numero di esami pratici sostenuti e il punteggio dell’esame finale di 10 studenti in una classe:
#create data frame df <- data. frame (score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94), hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3), prac_exams=c(2, 3, 3, 2, 4, 5, 4, 3, 5, 4)) #view data frame df score hours prac_exams 1 77 1 2 2 79 1 3 3 84 2 3 4 85 3 2 5 88 2 4 6 99 4 5 7 95 4 4 8 90 2 3 9 92 3 5 10 94 3 4
Supponiamo ora di voler adattare il seguente modello di regressione lineare multipla in R:
Punteggio esame = β 0 + β 1 (ore) + β 2 (esami pratici)
Possiamo usare la funzione lm() per adattare questo modello:
#fit multiple linear regression model
fit <- lm(score ~ hours + prac_exams, data=df)
Possiamo quindi utilizzare la funzione coeftest() per eseguire un t-test per ciascun coefficiente di regressione adattato nel modello:
library (lmtest)
#perform t-test for each coefficient in model
coeftest(fit)
t test of coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 68.40294 2.87227 23.8150 5.851e-08 ***
hours 4.19118 0.99612 4.2075 0.003998 **
prac_exams 2.69118 0.99612 2.7017 0.030566 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La statistica t-test e il corrispondente valore p vengono visualizzati per ciascun t-test:
- Intercetta : t = 23,8150, p = <0,000
- ore : t = 4,2075, p = 0,003998
- esami_prac : t = 2,7017, p = 0,030566
Si noti che utilizziamo le seguenti ipotesi nulle e alternative per ciascun test t:
- H 0 : β i = 0 (la pendenza è pari a zero)
- H A : β i ≠ 0 (la pendenza non è uguale a zero)
Se il valore p del t-test è inferiore a una certa soglia (ad esempio α = 0,05), allora rifiutiamo l’ipotesi nulla e concludiamo che esiste una relazione statisticamente significativa tra la variabile predittore e la variabile risposta.
Poiché il valore p per ciascun test t è inferiore a 0,05, dovremmo concludere che ciascuna variabile predittrice nel modello ha una relazione statisticamente significativa con la variabile di risposta.
Nel contesto di questo esempio, diremmo che le ore trascorse a studiare e il numero di esami pratici sostenuti sono entrambi predittori statisticamente significativi del voto finale degli studenti.
Risorse addizionali
Le esercitazioni seguenti forniscono informazioni aggiuntive sulla regressione lineare in R:
Come interpretare l’output della regressione in R
Come eseguire una regressione lineare semplice in R
Come eseguire la regressione lineare multipla in R
Come eseguire la regressione logistica in R