Come eseguire la regressione lineare multipla in stata
La regressione lineare multipla è un metodo che è possibile utilizzare per comprendere la relazione tra più variabili esplicative e una variabile di risposta.
Questo tutorial spiega come eseguire la regressione lineare multipla in Stata.
Esempio: regressione lineare multipla in Stata
Diciamo che vogliamo sapere se le miglia per gallone e il peso influiscono sul prezzo di un’auto. Per verificarlo, possiamo eseguire una regressione lineare multipla utilizzando miglia per gallone e peso come due variabili esplicative e prezzo come variabile di risposta.
Completa i seguenti passaggi in Stata per eseguire una regressione lineare multipla utilizzando il set di dati chiamato auto , che contiene dati su 74 auto diverse.
Passaggio 1: caricare i dati.
Caricare i dati digitando quanto segue nella casella di comando:
utilizzare https://www.stata-press.com/data/r13/auto
Passaggio 2: ottieni un riepilogo dei dati.
Ottieni una rapida comprensione dei dati con cui stai lavorando digitando quanto segue nella casella di comando:
riassumere
Possiamo vedere che ci sono 12 variabili diverse nel set di dati, ma le uniche che ci interessano sono mpg , peso e prezzo .
Possiamo vedere le seguenti statistiche riassuntive di base su queste tre variabili:
prezzo | media = $ 6.165, minimo = $ 3.291, massimo $ 15.906
mpg | media = 21,29, minimo = 12, massimo = 41
peso | media = 3.019 sterline, minimo = 1.760 sterline, massimo = 4.840 sterline
Passaggio 3: eseguire la regressione lineare multipla.
Digitare quanto segue nella casella Comando per eseguire una regressione lineare multipla utilizzando mpg e peso come variabili esplicative e prezzo come variabile di risposta.
prezzo di regressione peso mpg
Ecco come interpretare i numeri più interessanti nel risultato:
Prob > F: 0,000. Questo è il valore p per la regressione complessiva. Poiché questo valore è inferiore a 0,05, ciò indica che le variabili esplicative combinate di mpg e peso hanno una relazione statisticamente significativa con la variabile di risposta prezzo .
R quadrato: 0,2934. Questa è la proporzione della varianza nella variabile di risposta che può essere spiegata dalle variabili esplicative. In questo esempio, il 29,34% della variazione di prezzo può essere spiegato da mpg e peso.
Coef (mpg): -49.512. Questo ci dice la variazione media del prezzo associata ad un aumento di un’unità di mpg, assumendo che il peso rimanga costante . In questo esempio, ogni aumento di un’unità di mpg è associato a una diminuzione media di circa $ 49,51 nel prezzo, presupponendo che il peso rimanga costante.
Ad esempio, supponiamo che le auto A e B pesino entrambe 2.000 libbre. Se l’auto A consuma 20 mpg e l’auto B solo 19 mpg, ci aspetteremmo che il prezzo dell’auto A sia inferiore di $ 49,51 rispetto al prezzo dell’auto B.
P>|t| (mpg): 0,567. Questo è il valore p associato alla statistica del test per mpg. Poiché questo valore non è inferiore a 0,05, non abbiamo prove che il mpg abbia una relazione statisticamente significativa con il prezzo.
Coef (peso): 1.746. Questo ci dice la variazione media del prezzo associata ad un aumento di peso di un’unità, assumendo che mpg rimanga costante . In questo esempio, ogni aumento di peso di un’unità è associato a un aumento medio di circa $ 1,74 nel prezzo, assumendo che mpg rimanga costante.
Ad esempio, supponiamo che le auto A e B ottengano entrambe 20 mpg. Se l’auto A pesa mezzo chilo in più dell’auto B, allora l’auto A dovrebbe costare 1,74$ in più.
P>|t| (peso): 0,008. Questo è il valore p associato alla statistica del test per il peso. Poiché questo valore è inferiore a 0,05, abbiamo prove sufficienti per affermare che il peso ha una relazione statisticamente significativa con il prezzo.
Coef (_cons): 1946.069. Questo ci dice il prezzo medio di un’auto quando mpg e peso sono pari a zero. In questo esempio, il prezzo medio è $ 1.946 quando peso e mpg sono pari a zero. Questo non ha davvero senso da interpretare poiché il peso e il mpg di un’auto non possono essere zero, ma il numero 1946.069 è necessario per formare un’equazione di regressione.
Passaggio 4: riportare i risultati.
Infine, vogliamo riportare i risultati della nostra regressione lineare multipla. Ecco un esempio di come eseguire questa operazione:
È stata eseguita una regressione lineare multipla per quantificare la relazione tra il peso e il mpg di un’auto e il suo prezzo. Nell’analisi è stato utilizzato un campione di 74 automobili.
I risultati hanno mostrato che esisteva una relazione statisticamente significativa tra peso e prezzo (t = 2,72, p = 0,008), ma non esisteva alcuna relazione statisticamente significativa tra mpg e prezzo (e mpg (t = -0,57, p = 0,567).