Come calcolare l'intervallo di confidenza per la pendenza di regressione
La regressione lineare semplice viene utilizzata per quantificare la relazione tra una variabile predittore e una variabile di risposta.
Questo metodo trova la riga che meglio “corrisponde” a un insieme di dati e assume la forma seguente:
ŷ = b 0 + b 1 x
Oro:
- ŷ : il valore di risposta stimato
- b 0 : L’origine della retta di regressione
- b 1 : La pendenza della retta di regressione
- x : il valore della variabile predittiva
Siamo spesso interessati al valore di b 1 , che ci dice la variazione media nella variabile di risposta associata ad un aumento di un’unità nella variabile predittrice.
Possiamo utilizzare la seguente formula per calcolare un intervallo di confidenza per il valore di β 1 , il valore della pendenza per l’intera popolazione:
Intervallo di confidenza per β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
Oro:
- b 1 = coefficiente di pendenza mostrato nella tabella di regressione
- t 1-∝/2, n-2 = Il valore t critico per il livello di confidenza 1-∝ con n-2 gradi di libertà dove n è il numero totale di osservazioni nel nostro set di dati
- se(b 1 ) = L’errore standard di b 1 mostrato nella tabella di regressione
L’esempio seguente mostra come calcolare nella pratica un intervallo di confidenza per una pendenza di regressione.
Esempio: intervallo di confidenza per la pendenza della regressione
Supponiamo di voler adattare un semplice modello di regressione lineare utilizzando le ore di studio come variabile predittiva e i punteggi degli esami come variabile di risposta per 15 studenti in una particolare classe:
Possiamo eseguire una semplice regressione lineare in Excel e ricevere il seguente risultato:
Utilizzando le stime dei coefficienti nel risultato, possiamo scrivere il modello di regressione lineare semplice adattato come segue:
Punteggio = 65.334 + 1.982*(Ore studiate)
Il valore della pendenza di regressione è 1.982 .
Questo ci dice che ogni ora aggiuntiva di studio trascorsa è associata a un aumento medio di 1.982 nel punteggio dell’esame.
Possiamo utilizzare la seguente formula per calcolare un intervallo di confidenza al 95% per la pendenza:
- IC al 95% per β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
- IC al 95% per β 1 : 1,982 ± t 0,975, 15-2 * 0,248
- IC al 95% per β1 : 1,982 ± 2,1604 * 0,248
- IC al 95% per β 1 : [1,446, 2,518]
L’intervallo di confidenza al 95% per la pendenza di regressione è [1,446, 2,518] .
Poiché questo intervallo di confidenza non contiene il valore 0, possiamo concludere che esiste un’associazione statisticamente significativa tra ore studiate e voto dell’esame.
Nota : abbiamo utilizzato il calcolatore della distribuzione t inversa per trovare il valore t critico che corrisponde a un livello di confidenza del 95% con 13 gradi di libertà.
Risorse addizionali
Le seguenti esercitazioni forniscono informazioni aggiuntive sulla regressione lineare:
Introduzione alla regressione lineare semplice
Introduzione alla regressione lineare multipla
Come leggere e interpretare una tabella di regressione
Come riportare i risultati della regressione