Come ottenere valori predetti e residui in stata
La regressione lineare è un metodo che possiamo utilizzare per comprendere la relazione tra una o più variabili esplicative e una variabile di risposta.
Quando eseguiamo una regressione lineare su un set di dati, ci ritroviamo con un’equazione di regressione che può essere utilizzata per prevedere i valori di una variabile di risposta, dati i valori delle variabili esplicative.
Possiamo quindi misurare la differenza tra i valori previsti e i valori effettivi per ottenere i residui per ciascuna previsione. Questo ci aiuta a farci un’idea di quanto bene il nostro modello di regressione preveda i valori di risposta.
Questo tutorial spiega come ottenere sia i valori previsti che i residui per un modello di regressione in Stata.
Esempio: come ottenere valori e residui previsti
Per questo esempio, utilizzeremo il set di dati Stata integrato chiamato auto . Utilizzeremo mpg e cilindrata come variabili esplicative e il prezzo come variabile di risposta.
Utilizzare i passaggi seguenti per eseguire una regressione lineare e quindi ottenere i valori e i residui previsti per il modello di regressione.
Passaggio 1: caricare e visualizzare i dati.
Innanzitutto, caricheremo i dati utilizzando il seguente comando:
utilizzo automatico del sistema
Successivamente, otterremo un breve riepilogo dei dati utilizzando il seguente comando:
riassumere
Passaggio 2: adattare il modello di regressione.
Successivamente, utilizzeremo il seguente comando per adattare il modello di regressione:
cilindrata del prezzo di regressione mpg
L’equazione di regressione stimata è:
prezzo stimato = 6672.766 -121.1833*(mpg) + 10.50885*(cilindrata)
Passaggio 3: ottenere i valori previsti.
Possiamo ottenere i valori previsti utilizzando il comando predittivo e memorizzando questi valori in una variabile denominata come desideriamo. In questo caso utilizzeremo il nome pred_price :
prevedere pred_price
Possiamo visualizzare i prezzi effettivi e quelli previsti fianco a fianco utilizzando il comando list . Ci sono 74 valori previsti in totale, ma visualizzeremo solo i primi 10 utilizzando il comando in 1/10 :
prezzo di listino pred_price in 1/10
Passaggio 4: ottenere il residuo.
Possiamo ottenere i residui di ciascuna previsione utilizzando il comando residui e memorizzando questi valori in una variabile denominata come vogliamo. In questo caso, utilizzeremo il nome resid_price :
prevedere residence_price, residui
Possiamo visualizzare il prezzo effettivo, il prezzo previsto e i residui fianco a fianco utilizzando nuovamente il comando list :
prezzo di listino pred_price resid_price in 1/10
Passaggio 5: creare un grafico dei valori previsti rispetto ai residui.
Infine, possiamo creare un grafico a dispersione per visualizzare la relazione tra i valori previsti e i residui:
dispersione reside_price pred_price
Possiamo vedere che in media i residui tendono ad aumentare all’aumentare dei valori adattati. Questo potrebbe essere un segno di eteroschedasticità – quando la distribuzione dei residui non è costante a ciascun livello di risposta.
Potremmo testare formalmente l’eteroschedasticità utilizzando il test di Breusch-Pagan e risolverlo utilizzando errori standard robusti .