Come ottenere valori predetti e residui in stata


La regressione lineare è un metodo che possiamo utilizzare per comprendere la relazione tra una o più variabili esplicative e una variabile di risposta.

Quando eseguiamo una regressione lineare su un set di dati, ci ritroviamo con un’equazione di regressione che può essere utilizzata per prevedere i valori di una variabile di risposta, dati i valori delle variabili esplicative.

Possiamo quindi misurare la differenza tra i valori previsti e i valori effettivi per ottenere i residui per ciascuna previsione. Questo ci aiuta a farci un’idea di quanto bene il nostro modello di regressione preveda i valori di risposta.

Questo tutorial spiega come ottenere sia i valori previsti che i residui per un modello di regressione in Stata.

Esempio: come ottenere valori e residui previsti

Per questo esempio, utilizzeremo il set di dati Stata integrato chiamato auto . Utilizzeremo mpg e cilindrata come variabili esplicative e il prezzo come variabile di risposta.

Utilizzare i passaggi seguenti per eseguire una regressione lineare e quindi ottenere i valori e i residui previsti per il modello di regressione.

Passaggio 1: caricare e visualizzare i dati.

Innanzitutto, caricheremo i dati utilizzando il seguente comando:

utilizzo automatico del sistema

Successivamente, otterremo un breve riepilogo dei dati utilizzando il seguente comando:

riassumere

Riassumi l'ordine in Stata

Passaggio 2: adattare il modello di regressione.

Successivamente, utilizzeremo il seguente comando per adattare il modello di regressione:

cilindrata del prezzo di regressione mpg

Output del modello di regressione in Stata

L’equazione di regressione stimata è:

prezzo stimato = 6672.766 -121.1833*(mpg) + 10.50885*(cilindrata)

Passaggio 3: ottenere i valori previsti.

Possiamo ottenere i valori previsti utilizzando il comando predittivo e memorizzando questi valori in una variabile denominata come desideriamo. In questo caso utilizzeremo il nome pred_price :

prevedere pred_price

Possiamo visualizzare i prezzi effettivi e quelli previsti fianco a fianco utilizzando il comando list . Ci sono 74 valori previsti in totale, ma visualizzeremo solo i primi 10 utilizzando il comando in 1/10 :

prezzo di listino pred_price in 1/10

Valori effettivi e predetti nella regressione in Stata

Passaggio 4: ottenere il residuo.

Possiamo ottenere i residui di ciascuna previsione utilizzando il comando residui e memorizzando questi valori in una variabile denominata come vogliamo. In questo caso, utilizzeremo il nome resid_price :

prevedere residence_price, residui

Possiamo visualizzare il prezzo effettivo, il prezzo previsto e i residui fianco a fianco utilizzando nuovamente il comando list :

prezzo di listino pred_price resid_price in 1/10

residui rispetto ai valori previsti in Stata

Passaggio 5: creare un grafico dei valori previsti rispetto ai residui.

Infine, possiamo creare un grafico a dispersione per visualizzare la relazione tra i valori previsti e i residui:

dispersione reside_price pred_price

Grafico dei residui rispetto ai valori previsti in Stata

Possiamo vedere che in media i residui tendono ad aumentare all’aumentare dei valori adattati. Questo potrebbe essere un segno di eteroschedasticità – quando la distribuzione dei residui non è costante a ciascun livello di risposta.

Potremmo testare formalmente l’eteroschedasticità utilizzando il test di Breusch-Pagan e risolverlo utilizzando errori standard robusti .

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *