Come utilizzare la funzione coeftest() in r


È possibile utilizzare la funzione coeftest() del pacchetto lmtest in R per eseguire un test t per ogni coefficiente stimato in un modello di regressione.

Questa funzione utilizza la seguente sintassi di base:

coeftest(x)

Oro:

  • x : nome del modello di regressione adattato

L’esempio seguente mostra come utilizzare questa funzione nella pratica.

Esempio: come utilizzare la funzione coeftest() in R

Supponiamo di avere il seguente frame di dati in R che mostra il numero di ore trascorse a studiare, il numero di esami pratici sostenuti e il punteggio dell’esame finale di 10 studenti in una classe:

 #create data frame
df <- data. frame (score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94),
                 hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3),
                 prac_exams=c(2, 3, 3, 2, 4, 5, 4, 3, 5, 4))

#view data frame
df

   score hours prac_exams
1 77 1 2
2 79 1 3
3 84 2 3
4 85 3 2
5 88 2 4
6 99 4 5
7 95 4 4
8 90 2 3
9 92 3 5
10 94 3 4

Supponiamo ora di voler adattare il seguente modello di regressione lineare multipla in R:

Punteggio esame = β 0 + β 1 (ore) + β 2 (esami pratici)

Possiamo usare la funzione lm() per adattare questo modello:

 #fit multiple linear regression model
fit <- lm(score ~ hours + prac_exams, data=df)

Possiamo quindi utilizzare la funzione coeftest() per eseguire un t-test per ciascun coefficiente di regressione adattato nel modello:

 library (lmtest)

#perform t-test for each coefficient in model
coeftest(fit)

t test of coefficients:

            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 68.40294 2.87227 23.8150 5.851e-08 ***
hours 4.19118 0.99612 4.2075 0.003998 ** 
prac_exams 2.69118 0.99612 2.7017 0.030566 *  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La statistica t-test e il corrispondente valore p vengono visualizzati per ciascun t-test:

  • Intercetta : t = 23,8150, p = <0,000
  • ore : t = 4,2075, p = 0,003998
  • esami_prac : t = 2,7017, p = 0,030566

Si noti che utilizziamo le seguenti ipotesi nulle e alternative per ciascun test t:

  • H 0 : β i = 0 (la pendenza è pari a zero)
  • H A : β i ≠ 0 (la pendenza non è uguale a zero)

Se il valore p del t-test è inferiore a una certa soglia (ad esempio α = 0,05), allora rifiutiamo l’ipotesi nulla e concludiamo che esiste una relazione statisticamente significativa tra la variabile predittore e la variabile risposta.

Poiché il valore p per ciascun test t è inferiore a 0,05, dovremmo concludere che ciascuna variabile predittrice nel modello ha una relazione statisticamente significativa con la variabile di risposta.

Nel contesto di questo esempio, diremmo che le ore trascorse a studiare e il numero di esami pratici sostenuti sono entrambi predittori statisticamente significativi del voto finale degli studenti.

Risorse addizionali

Le esercitazioni seguenti forniscono informazioni aggiuntive sulla regressione lineare in R:

Come interpretare l’output della regressione in R
Come eseguire una regressione lineare semplice in R
Come eseguire la regressione lineare multipla in R
Come eseguire la regressione logistica in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *