Come eseguire la regressione quadratica in stata
Quando due variabili hanno una relazione lineare, spesso è possibile utilizzare la regressione lineare semplice per quantificare la relazione.
Tuttavia, quando due variabili hanno una relazione quadratica, è possibile utilizzare la regressione quadratica per quantificare la relazione.
Questo tutorial spiega come eseguire la regressione quadratica in Stata.
Esempio: regressione quadratica in Stata
Supponiamo di voler comprendere la relazione tra il numero di ore lavorate e la felicità. Disponiamo dei seguenti dati sul numero di ore lavorate a settimana e sul livello di felicità riportato (su una scala da 0 a 100) per 16 persone diverse:
Puoi riprodurre questo esempio inserendo questi dati esatti in Stata utilizzando Dati > Editor dati > Editor dati (Modifica) nel menu in alto.
Utilizzare i passaggi seguenti per eseguire la regressione quadratica in Stata.
Passaggio 1: visualizzare i dati.
Prima di poter utilizzare la regressione quadratica, dobbiamo garantire che la relazione tra la variabile esplicativa (ore) e la variabile di risposta (felicità) sia effettivamente quadratica. Quindi visualizziamo i dati utilizzando un grafico a dispersione digitando quanto segue nella casella di comando:
disperdere le ore della felicità
Ciò produce il seguente grafico a dispersione:
Possiamo vedere che la felicità tende ad aumentare man mano che il numero di ore lavorate aumenta da zero fino a un certo punto, ma poi inizia a diminuire quando il numero di ore lavorate supera le 30 circa.
Questa forma a “U” rovesciata nel grafico a dispersione indica che esiste una relazione quadratica tra le ore lavorate e la felicità, il che significa che dovremmo utilizzare la regressione quadratica per quantificare questa relazione.
Passaggio 2: eseguire la regressione quadratica.
Prima di adattare il modello di regressione quadratica ai dati, dobbiamo creare una nuova variabile per i valori al quadrato della nostra variabile predittore delle ore . Possiamo farlo digitando quanto segue nella casella Comando:
gen ore2 = ore*ore
Possiamo visualizzare questa nuova variabile andando su Dati > Editor dati > Editor dati (Sfoglia) dal menu in alto.
Possiamo vedere che ore2 è semplicemente ore al quadrato. Possiamo ora eseguire una regressione quadratica utilizzando ore e ore2 come variabili esplicative e la felicità come variabile di risposta. Per eseguire una regressione quadratica, digitare quanto segue nella casella Comando:
regredire ore di felicità ore2
Ecco come interpretare i numeri più interessanti nel risultato:
Prob > F: 0,000. Questo è il valore p per la regressione complessiva. Poiché questo valore è inferiore a 0,05, ciò significa che le variabili predittive ore e ore 2 combinate hanno una relazione statisticamente significativa con la variabile di risposta felicità .
R quadrato: 0,9092. Questa è la proporzione della varianza nella variabile di risposta che può essere spiegata dalla variabile esplicativa. In questo esempio, il 90,92% della variazione della felicità può essere spiegata in ore e ore 2 .
Equazione di regressione: possiamo formare un’equazione di regressione utilizzando i valori dei coefficienti mostrati nella tabella di output. In questo caso l’equazione sarebbe:
felicità prevista = -30,25287 + 7,173061 (ore) – 0,1069887 ( 2 ore)
Possiamo usare questa equazione per trovare la felicità prevista di un individuo, dato il numero di ore di lavoro settimanali.
Ad esempio, una persona che lavora 60 ore settimanali dovrebbe avere un livello di felicità di 14,97:
felicità prevista = -30,25287 + 7,173061(60) – ,1069887(60 2 ) = 14,97 .
Al contrario, una persona che lavora 30 ore settimanali dovrebbe avere un livello di felicità di 88,65:
felicità prevista = -30,25287 + 7,173061(30) – 0,1069887(30 2 ) = 88,65 .
Passaggio 3: riportare i risultati.
Infine, vogliamo riportare i risultati della nostra regressione quadratica. Ecco un esempio di come eseguire questa operazione:
È stata eseguita una regressione quadratica per quantificare la relazione tra il numero di ore lavorate da un individuo e il corrispondente livello di felicità (misurato da 0 a 100). Nell’analisi è stato utilizzato un campione di 16 persone.
I risultati hanno mostrato che esisteva una relazione statisticamente significativa tra le variabili esplicative ore e ore 2 e la variabile di risposta felicità (F(2, 13) = 65,09, p < 0,0001).
Insieme, queste due variabili esplicative rappresentavano il 90,92% della variabilità spiegata della felicità.
L’equazione di regressione risultò essere:
felicità prevista = -30,25287 + 7,173061 (ore) – 0,1069887 ( 2 ore)