Distorsione da variabili omesse: definizione ed esempi


La distorsione da variabili omesse si verifica quando una variabile esplicativa rilevante non è inclusa in un modello di regressione , il che può comportare una distorsione nel coefficiente di una o più variabili esplicative nel modello.

Una variabile omessa viene spesso esclusa da un modello di regressione per uno dei due motivi:

1. I dati per la variabile semplicemente non sono disponibili.

2. L’effetto della variabile esplicativa sulla variabile di risposta non è noto.

Affinché la variabile omessa distorca effettivamente i coefficienti del modello, devono essere soddisfatte le seguenti due condizioni:

1. La variabile omessa deve essere correlata con una o più variabili esplicative nel modello.

2. La variabile omessa deve essere correlata con la variabile di risposta nel modello.

Gli effetti della distorsione da variabili omesse

Supponiamo di avere due variabili esplicative, A e B, e una variabile di risposta, Y. Supponiamo di adattare un modello di regressione lineare semplice con A come unica variabile esplicativa e di lasciare B fuori dal modello.

Se B è correlato ad A e correlato a Y, ciò si tradurrà in una distorsione nella stima del coefficiente di A. Il diagramma seguente mostra come la stima del coefficiente di A sarà distorta, a seconda della natura della relazione con B:

Distorsione da variabile omessa

Esempio: distorsione da variabile omessa

Supponiamo di voler studiare l’effetto della metratura sul prezzo degli immobili e quindi applichiamo il seguente semplice modello di regressione lineare:

Prezzo della casa = B 0 + B 1 (area quadrata)

Supponiamo di trovare che il modello stimato è:

Prezzo della casa = 40.203,91 + 118,31 (superficie quadrata)

Il modo in cui interpretiamo il coefficiente della metratura è che ogni ulteriore aumento di un’unità di metratura è associato a un aumento del prezzo delle case in media di $ 118,31.

Tuttavia, supponiamo di tralasciare la variabile esplicativa età che risulta essere fortemente correlata negativamente con la metratura e fortemente correlata negativamente con il prezzo degli immobili. Questa variabile dovrebbe essere nel modello, ma non lo è. Pertanto, la stima del coefficiente per la metratura è probabilmente distorta.

Poiché l’età è correlata negativamente sia con la variabile esplicativa che con quella di risposta nel modello, ci aspettiamo che la stima del coefficiente per la metratura sia distorta positivamente:

Distorsione positiva con distorsione da variabili omesse

Supponiamo di trovare i dati sull’età dell’abitazione e di includerli nel modello. Il modello diventa quindi:

Prezzo della casa = B 0 + B 1 (area quadrata) + B 2 (età)

Supponiamo di trovare che il modello stimato è:

Prezzo della casa = 123.426,20 + 81,06 (superficie quadrata) – 1.291,04 (età)

Si noti che la stima del coefficiente per la metratura è diminuita in modo significativo, il che significa che nel modello precedente era distorta positivamente.

Il modo in cui interpretiamo il coefficiente di metratura in questo modello è che ogni ulteriore aumento di un’unità di metratura è associato a un aumento medio del prezzo delle case di $ 81,06, assumendo che l’età rimanga costante.

Cosa fare in caso di distorsione da variabili omesse

Sfortunatamente, la distorsione da variabili omesse si verifica spesso nel mondo reale perché alcune variabili dovrebbero generalmente essere incluse in un modello di regressione, ma non lo sono perché i dati relativi non sono disponibili o la relazione tra loro e la variabile di risposta è sconosciuta.

Se possibile, dovresti provare a includere tutte le variabili esplicative rilevanti in un modello di regressione in modo da poter comprendere la vera relazione tra le variabili esplicative e la variabile di risposta.

Escludere variabili esplicative rilevanti da un modello può influenzare significativamente l’interpretazione del modello, come abbiamo visto nell’esempio precedente con i prezzi immobiliari.

Risorse addizionali

Cos’è una variabile nascosta?
Cos’è una variabile confusa?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *