Come eseguire un test f parziale in excel
Un test F parziale viene utilizzato per determinare se esiste o meno una differenza statisticamente significativa tra un modello di regressione e una versione nidificata dello stesso modello.
Un modello nidificato è semplicemente un modello che contiene un sottoinsieme di variabili predittive nel modello di regressione complessivo.
Ad esempio, supponiamo di avere il seguente modello di regressione con quattro variabili predittive:
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
Un esempio di modello nidificato sarebbe il seguente modello con solo due delle variabili predittive originali:
Y = β 0 + β 1 x 1 + β 2 x 2 + ε
Per determinare se questi due modelli sono significativamente diversi, possiamo eseguire un test F parziale, che calcola la seguente statistica del test F:
F = (( RSS ridotto – RSS completo )/p) / ( RSS completo /nk)
Oro:
- RSS ridotto : la somma residua dei quadrati del modello ridotto (cioè “nidificato”).
- RSS pieno : la somma residua dei quadrati del modello completo.
- p: numero di predittori rimossi dal modello completo.
- n: il numero totale di osservazioni nel set di dati.
- k: il numero di coefficienti (inclusa l’intercetta) nel modello completo.
Questo test utilizza le seguenti ipotesi nulle e alternative:
H 0 : tutti i coefficienti rimossi dal modello completo sono zero.
H A : Almeno uno dei coefficienti rimossi dal modello completo è diverso da zero.
Se il valore p corrispondente alla statistica F-test è inferiore a un certo livello di significatività (ad esempio 0,05), allora possiamo rifiutare l’ipotesi nulla e concludere che almeno uno dei coefficienti rimossi dal modello completo è significativo.
L’esempio seguente mostra come eseguire un test F parziale in Excel.
Esempio: test F parziale in Excel
Supponiamo di avere il seguente set di dati in Excel:
Supponiamo di voler determinare se esiste una differenza tra i seguenti due modelli di regressione:
Modello completo: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4
Modello ridotto: y = β 0 + β 1 x 1 + β 2 x 2
Possiamo eseguire una regressione lineare multipla in Excel per ciascun modello per ottenere il seguente risultato:
Possiamo quindi utilizzare la seguente formula per calcolare la statistica del test F per il test F parziale:
La statistica del test risulta essere 2.064 .
Possiamo quindi utilizzare la seguente formula per calcolare il valore p corrispondente:
Il valore p risulta essere 0,1974 .
Poiché questo valore p non è inferiore a 0,05, non riusciremo a rifiutare l’ipotesi nulla. Ciò significa che non abbiamo prove sufficienti per affermare che una delle variabili predittive x3 o x4 sia statisticamente significativa.
In altre parole, l’aggiunta di x3 e x4 al modello di regressione non migliora significativamente l’adattamento del modello.
Risorse addizionali
Come eseguire una regressione lineare semplice in Excel
Come eseguire una regressione lineare multipla in Excel
Come calcolare l’errore standard di regressione in Excel