Comprensione del test t nella regressione lineare


La regressione lineare viene utilizzata per quantificare la relazione tra una variabile predittore e una variabile di risposta.

Ogni volta che eseguiamo una regressione lineare, vogliamo sapere se esiste una relazione statisticamente significativa tra la variabile predittore e la variabile risposta.

Verifichiamo la significatività eseguendo un test t per la pendenza di regressione. Usiamo la seguente ipotesi nulla e alternativa per questo t-test:

  • H 0 : β 1 = 0 (la pendenza è pari a zero)
  • H A : β 1 ≠ 0 (la pendenza non è uguale a zero)

Calcoliamo quindi la statistica del test come segue:

t = b / SE b

Oro:

  • b : stima del coefficiente
  • SE b : errore standard della stima del coefficiente

Se il valore p che corrisponde a t è inferiore ad una certa soglia (ad esempio α = 0,05), allora rifiutiamo l’ipotesi nulla e concludiamo che esiste una relazione statisticamente significativa tra la variabile predittore e la variabile risposta.

L’esempio seguente mostra come eseguire nella pratica un t-test per un modello di regressione lineare.

Esempio: esecuzione di un test t per la regressione lineare

Supponiamo che un professore voglia analizzare la relazione tra le ore studiate e i voti degli esami di 40 suoi studenti.

Esegue una semplice regressione lineare utilizzando le ore studiate come variabile predittiva e i punteggi degli esami ricevuti come variabile di risposta.

La tabella seguente mostra i risultati del modello di regressione:

Per determinare se le ore studiate hanno una relazione statisticamente significativa con il voto dell’esame finale, possiamo eseguire un t-test.

Usiamo la seguente ipotesi nulla e alternativa per questo t-test:

  • H 0 : β 1 = 0 (la pendenza delle ore studiate è pari a zero)
  • H A : β 1 ≠ 0 (la pendenza delle ore studiate non è uguale a zero)

Calcoliamo quindi la statistica del test come segue:

  • t = b / SE b
  • t = 1.117/1.025
  • t = 1.089

Il valore p che corrisponde a t = 1.089 con df = n-2 = 40 – 2 = 38 è 0.283 .

Tieni presente che possiamo anche utilizzare il calcolatore del punteggio T in valore P per calcolare questo valore p:

Poiché questo valore p non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla.

Ciò significa che le ore studiate non hanno una relazione statisticamente significativa tra i risultati dell’esame finale.

Risorse addizionali

Le seguenti esercitazioni forniscono informazioni aggiuntive sulla regressione lineare:

Introduzione alla regressione lineare semplice
Introduzione alla regressione lineare multipla
Come interpretare i coefficienti di regressione
Come interpretare il test F per la significatività complessiva nella regressione

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *