Come eseguire la regressione lineare multipla in stata


La regressione lineare multipla è un metodo che è possibile utilizzare per comprendere la relazione tra più variabili esplicative e una variabile di risposta.

Questo tutorial spiega come eseguire la regressione lineare multipla in Stata.

Esempio: regressione lineare multipla in Stata

Diciamo che vogliamo sapere se le miglia per gallone e il peso influiscono sul prezzo di un’auto. Per verificarlo, possiamo eseguire una regressione lineare multipla utilizzando miglia per gallone e peso come due variabili esplicative e prezzo come variabile di risposta.

Completa i seguenti passaggi in Stata per eseguire una regressione lineare multipla utilizzando il set di dati chiamato auto , che contiene dati su 74 auto diverse.

Passaggio 1: caricare i dati.

Caricare i dati digitando quanto segue nella casella di comando:

utilizzare https://www.stata-press.com/data/r13/auto

Passaggio 2: ottieni un riepilogo dei dati.

Ottieni una rapida comprensione dei dati con cui stai lavorando digitando quanto segue nella casella di comando:

riassumere

Riepilogare i dati in Stata

Possiamo vedere che ci sono 12 variabili diverse nel set di dati, ma le uniche che ci interessano sono mpg , peso e prezzo .

Possiamo vedere le seguenti statistiche riassuntive di base su queste tre variabili:

prezzo | media = $ 6.165, minimo = $ 3.291, massimo $ 15.906

mpg | media = 21,29, minimo = 12, massimo = 41

peso | media = 3.019 sterline, minimo = 1.760 sterline, massimo = 4.840 sterline

Passaggio 3: eseguire la regressione lineare multipla.

Digitare quanto segue nella casella Comando per eseguire una regressione lineare multipla utilizzando mpg e peso come variabili esplicative e prezzo come variabile di risposta.

prezzo di regressione peso mpg

Output di regressione multipla in Stata

Ecco come interpretare i numeri più interessanti nel risultato:

Prob > F: 0,000. Questo è il valore p per la regressione complessiva. Poiché questo valore è inferiore a 0,05, ciò indica che le variabili esplicative combinate di mpg e peso hanno una relazione statisticamente significativa con la variabile di risposta prezzo .

R quadrato: 0,2934. Questa è la proporzione della varianza nella variabile di risposta che può essere spiegata dalle variabili esplicative. In questo esempio, il 29,34% della variazione di prezzo può essere spiegato da mpg e peso.

Coef (mpg): -49.512. Questo ci dice la variazione media del prezzo associata ad un aumento di un’unità di mpg, assumendo che il peso rimanga costante . In questo esempio, ogni aumento di un’unità di mpg è associato a una diminuzione media di circa $ 49,51 nel prezzo, presupponendo che il peso rimanga costante.

Ad esempio, supponiamo che le auto A e B pesino entrambe 2.000 libbre. Se l’auto A consuma 20 mpg e l’auto B solo 19 mpg, ci aspetteremmo che il prezzo dell’auto A sia inferiore di $ 49,51 rispetto al prezzo dell’auto B.

P>|t| (mpg): 0,567. Questo è il valore p associato alla statistica del test per mpg. Poiché questo valore non è inferiore a 0,05, non abbiamo prove che il mpg abbia una relazione statisticamente significativa con il prezzo.

Coef (peso): 1.746. Questo ci dice la variazione media del prezzo associata ad un aumento di peso di un’unità, assumendo che mpg rimanga costante . In questo esempio, ogni aumento di peso di un’unità è associato a un aumento medio di circa $ 1,74 nel prezzo, assumendo che mpg rimanga costante.

Ad esempio, supponiamo che le auto A e B ottengano entrambe 20 mpg. Se l’auto A pesa mezzo chilo in più dell’auto B, allora l’auto A dovrebbe costare 1,74$ in più.

P>|t| (peso): 0,008. Questo è il valore p associato alla statistica del test per il peso. Poiché questo valore è inferiore a 0,05, abbiamo prove sufficienti per affermare che il peso ha una relazione statisticamente significativa con il prezzo.

Coef (_cons): 1946.069. Questo ci dice il prezzo medio di un’auto quando mpg e peso sono pari a zero. In questo esempio, il prezzo medio è $ 1.946 quando peso e mpg sono pari a zero. Questo non ha davvero senso da interpretare poiché il peso e il mpg di un’auto non possono essere zero, ma il numero 1946.069 è necessario per formare un’equazione di regressione.

Passaggio 4: riportare i risultati.

Infine, vogliamo riportare i risultati della nostra regressione lineare multipla. Ecco un esempio di come eseguire questa operazione:

È stata eseguita una regressione lineare multipla per quantificare la relazione tra il peso e il mpg di un’auto e il suo prezzo. Nell’analisi è stato utilizzato un campione di 74 automobili.

I risultati hanno mostrato che esisteva una relazione statisticamente significativa tra peso e prezzo (t = 2,72, p = 0,008), ma non esisteva alcuna relazione statisticamente significativa tra mpg e prezzo (e mpg (t = -0,57, p = 0,567).

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *