Come eseguire la regressione quadratica in excel


La regressione è una tecnica statistica che possiamo utilizzare per spiegare la relazione tra una o più variabili predittive e una variabile di risposta. Il tipo più comune di regressione è la regressione lineare , che utilizziamo quando la relazione tra la variabile predittore e la variabile di risposta è lineare .

In altre parole, quando la variabile predittore aumenta, anche la variabile risposta tende ad aumentare. Ad esempio, possiamo utilizzare un modello di regressione lineare per descrivere la relazione tra il numero di ore studiate (variabile predittore) e il voto che uno studente riceve in un esame (variabile di risposta).

Tuttavia, a volte la relazione tra una variabile predittore e una variabile di risposta non è lineare . Un tipo comune di relazione non lineare è la relazione quadratica , che può apparire come una U o una U capovolta su un grafico.

Cioè, all’aumentare della variabile predittiva, anche la variabile di risposta tende ad aumentare, ma dopo un certo punto la variabile di risposta inizia a diminuire mentre la variabile predittiva continua ad aumentare.

Ad esempio, possiamo utilizzare un modello di regressione quadratica per descrivere la relazione tra il numero di ore trascorse a lavorare e il livello di felicità riportato da una persona. Forse più una persona lavora, più si sente soddisfatta, ma una volta raggiunta una certa soglia, più lavoro porta effettivamente allo stress e a una diminuzione della felicità. In questo caso, un modello di regressione quadratica si adatterebbe meglio ai dati rispetto a un modello di regressione lineare.

Esaminiamo un esempio di come eseguire la regressione quadratica in Excel.

Regressione quadratica in Excel

Supponiamo di avere dati sul numero di ore lavorate a settimana e sul livello di felicità riportato (su una scala da 0 a 100) per 16 persone diverse:

Innanzitutto, creiamo un grafico a dispersione per vedere se la regressione lineare è un modello adatto per adattare i dati.

Evidenzia le celle A2:B17 . Successivamente, fai clic sulla scheda INSERISCI lungo la barra multifunzione superiore, quindi fai clic su Dispersione nell’area Grafici . Ciò produrrà un grafico a dispersione dei dati:

È facile vedere che la relazione tra ore lavorate e felicità riferita non è lineare. Infatti, segue una forma a “U”, rendendolo un candidato perfetto per la regressione quadratica .

Prima di adattare il modello di regressione quadratica ai dati, dobbiamo creare una nuova colonna per i valori al quadrato della nostra variabile predittrice.

Innanzitutto, evidenzia tutti i valori nella colonna B e trascinali nella colonna C.

Successivamente, digita la formula =A2^2 nella cella B2. Questo produce il valore 36 . Successivamente, fai clic sull’angolo in basso a destra della cella B2 e trascina la formula verso il basso per riempire le celle rimanenti nella colonna B.

Successivamente, adatteremo il modello di regressione quadratica.

Fai clic su DATI lungo la barra multifunzione in alto, quindi fai clic sull’opzione Analisi dati all’estrema destra. Se non vedi questa opzione, devi prima installare il software gratuito Analysis ToolPak .

Dopo aver fatto clic su Analisi dati , verrà visualizzata una casella. Fare clic su Regressione , quindi su OK .

Successivamente, inserisci i seguenti valori nella casella Regressione visualizzata. Quindi fare clic su OK .

Verranno visualizzati i seguenti risultati:

Ecco come interpretare i diversi numeri nell’output:

R quadrato: noto anche come coefficiente di determinazione, è la proporzione della varianza nella variabile di risposta che può essere spiegata dalle variabili predittive. In questo esempio, il quadrato R è 0,9092 , indicando che il 90,92% della varianza nei livelli di felicità riportati può essere spiegato dal numero di ore lavorate e dal numero di ore lavorate ^2.

Errore standard: l’errore standard della regressione è la distanza media tra i valori osservati e la retta di regressione. In questo esempio i valori osservati si discostano in media di 9.519 unità dalla retta di regressione.

Statistica F : la statistica F viene calcolata come MS di regressione/MS residuo. Questa statistica indica se il modello di regressione fornisce un adattamento migliore ai dati rispetto a un modello che non contiene variabili indipendenti. Essenzialmente, verifica se il modello di regressione nel suo insieme è utile. In genere, se nessuna delle variabili predittive nel modello è statisticamente significativa, anche la statistica F complessiva non è statisticamente significativa. In questo esempio, la statistica F è 65,09 e il valore p corrispondente è <0,0001. Poiché questo valore p è inferiore a 0,05, il modello di regressione nel suo insieme è significativo.

Coefficienti di regressione: i coefficienti di regressione nell’ultima tabella ci forniscono i numeri necessari per scrivere l’equazione di regressione stimata:

y cappello = b 0 + b 1 x 1 + b 2 x 1 2

In questo esempio, l’equazione di regressione stimata è:

livello di felicità dichiarato = -30,252 + 7,173 (Ore lavorate) -0,106 (Ore lavorate) 2

Possiamo usare questa equazione per calcolare il livello di felicità atteso di un individuo in base alle ore lavorate. Ad esempio, il livello atteso di felicità di una persona che lavora 30 ore settimanali è:

livello di felicità riportato = -30.252 + 7.173(30) -0.106(30) 2 = 88.649 .

Risorse addizionali

Come aggiungere una linea di tendenza quadratica in Excel
Come leggere e interpretare una tabella di regressione

Qual è un buon valore di R quadrato?
Comprendere l’errore standard di regressione
Una semplice guida per comprendere il test F della significatività complessiva nella regressione

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *