Excel: calcola l'intervallo di confidenza per il coefficiente di regressione


In un modello di regressione lineare, un coefficiente di regressione ci dice la variazione media nella variabile di risposta associata ad un aumento di un’unità della variabile predittrice.

Possiamo utilizzare la seguente formula per calcolare un intervallo di confidenza per un coefficiente di regressione:

Intervallo di confidenza per β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )

Oro:

  •   b 1 = coefficiente di regressione mostrato nella tabella di regressione
  • t 1-∝/2, n-2 = Il valore t critico per il livello di confidenza 1-∝ con n-2 gradi di libertà dove n è il numero totale di osservazioni nel nostro set di dati
  • se(b 1 ) = L’errore standard di b 1 mostrato nella tabella di regressione

L’esempio seguente mostra come calcolare un intervallo di confidenza per un coefficiente di regressione in Excel.

Esempio: intervallo di confidenza per il coefficiente di regressione in Excel

Supponiamo di voler adattare un semplice modello di regressione lineare utilizzando le ore di studio come variabile predittiva e i punteggi degli esami come variabile di risposta per 15 studenti in una particolare classe:

Possiamo digitare la seguente formula nella cella D2 per eseguire una regressione lineare semplice utilizzando i valori nella colonna Ore come variabile predittore e i valori nella colonna Punteggio come variabile di risposta:

 =LINEST( B2:B16 , A2:A16 , TRUE, TRUE)

Si noti che il primo argomento VERO indica a Excel di calcolare normalmente l’intercetta dell’equazione di regressione senza forzarla a essere zero.

Il secondo argomento VERO indica a Excel di produrre statistiche di regressione aggiuntive oltre ai coefficienti.

Lo screenshot seguente mostra il risultato di questa formula (spieghiamo cosa rappresenta ciascun valore di output nel testo rosso sotto l’output):

Utilizzando i coefficienti di regressione, possiamo scrivere l’equazione di regressione adattata come segue:

Punteggio = 65.334 + 1.982*(Ore studiate)

Si noti che il coefficiente di regressione per le ore è 1.982 .

Questo ci dice che ogni ora aggiuntiva di studio trascorsa è associata a un aumento medio di 1.982 nel punteggio dell’esame.

Per calcolare un intervallo di confidenza al 95% per il coefficiente di regressione, possiamo inserire le seguenti formule nelle celle H2 e H3:

  • H2: = D2 – T.INV.2T(0,05, E5)*D3
  • H3: = D2 + T.INV.2T(0,05, E5)*D3

La schermata seguente mostra come utilizzare queste formule nella pratica:

intervallo di confidenza per il coefficiente di regressione in Excel

L’intervallo di confidenza al 95% per il coefficiente di regressione è [1,446, 2,518] .

Poiché questo intervallo di confidenza non contiene il valore 0 , possiamo concludere che esiste un’associazione statisticamente significativa tra ore studiate e voto dell’esame.

Possiamo anche confermare che ciò è corretto calcolando manualmente l’intervallo di confidenza al 95% per il coefficiente di regressione:

  • IC al 95% per β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
  • IC al 95% per β 1 : 1,982 ± t 0,975, 15-2 * 0,248
  • IC al 95% per β1 : 1,982 ± 2,1604 * 0,248
  • IC al 95% per β 1 : [1,446, 2,518]

L’intervallo di confidenza al 95% per il coefficiente di regressione è [1,446, 2,518] .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in Excel:

Come eseguire una regressione lineare semplice in Excel
Come eseguire una regressione lineare multipla in Excel
Come interpretare i valori P nell’output di regressione in Excel

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *