Omoschedasticità

Questo articolo spiega cos’è l’omoschedasticità nelle statistiche. Quindi troverai la definizione di omoschedasticità, quali sono le cause per cui un modello di regressione non presenta omoschedasticità e altro ancora, come risolverlo.

Cos’è l’omoschedasticità?

L’omoschedasticità è una caratteristica di un modello di regressione i cui errori delle variabili esplicative hanno una varianza costante. Cioè, quando la varianza dell’errore di un modello di regressione è costante, detto modello presenta omoschedasticità e, quindi, è un modello omoschedastico.

Si ricorda che l’errore (o residuo) è definito come la differenza tra il valore reale e il valore stimato dal modello di regressione.

e_i=y_i-\widehat{y}_i

Quando eseguiamo un modello di regressione, otterremo un valore diverso dall’espressione precedente per ciascuna osservazione. Pertanto, un modello statistico omoschedastico è quello in cui la varianza degli errori calcolati è costante durante tutte le osservazioni.

Omoschedasticità ed eteroschedasticità

È importante che un modello di regressione presenti omoschedasticità; infatti, questa è una delle precedenti ipotesi dei modelli di regressione. Se i residui non sono omoschedastici è meglio rifare il modello in altro modo per ottenere l’omoschedasticità. In caso contrario, la stima dei coefficienti di regressione rischia di essere errata e si verificheranno errori nella verifica delle ipotesi anche accettando ipotesi nulle che in realtà dovrebbero essere rifiutate.

Cause di mancanza di omoschedasticità

Le cause più comuni per cui un modello non presenta omoschedasticità sono:

  • Quando l’ intervallo di dati è molto ampio rispetto alla media. Se nello stesso campione statistico sono presenti valori molto grandi e valori molto piccoli, è probabile che il modello di regressione ottenuto non sia omoschedastico.
  • Anche l’omissione delle variabili nel modello di regressione comporta una mancanza di omoschedasticità. Logicamente, se una variabile rilevante non è inclusa nel modello, la sua variazione sarà inclusa nei residui e non sarà necessariamente fissa.
  • Un cambiamento nella struttura può produrre uno scarso adattamento del modello al set di dati e, pertanto, la varianza dei residui non è costante.
  • Quando alcune variabili hanno valori molto più grandi delle altre variabili esplicative, il modello potrebbe non avere omoschedasticità. In questo caso, le variabili possono essere relativizzate per risolvere il problema.

Tuttavia, ci sono alcuni casi che sono intrinsecamente difficili da presentare come omoschedasticità. Ad esempio, se modelliamo il reddito di una persona con la sua spesa alimentare, le persone più ricche hanno una variabilità molto maggiore nella loro spesa alimentare rispetto alle persone più povere. Perché una persona ricca a volte mangia in ristoranti costosi e altre volte in ristoranti economici, a differenza di una persona povera che mangia sempre in ristoranti economici. Pertanto, è difficile ottenere l’omoschedasticità nel modello di regressione.

Correzione dei dati per ottenere l’omoschedasticità

Quando il modello di regressione ottenuto non è omoschedastico, è possibile tentare le seguenti correzioni per ottenere l’omoschedasticità:

  • Calcola il logaritmo naturale della variabile indipendente, questo è generalmente utile quando la varianza dei residui aumenta nel grafico.
  • A seconda del diagramma residuo, un altro tipo di trasformazione della variabile indipendente può essere più pratico. Ad esempio, se il grafico ha la forma di una parabola, possiamo calcolare il quadrato della variabile indipendente e aggiungere tale variabile al modello.
  • Per il modello possono essere utilizzate anche altre variabili; togliendo o aggiungendo una variabile si può modificare la varianza dei residui.
  • Invece di utilizzare il criterio dei minimi quadrati, è possibile utilizzare il criterio dei minimi quadrati ponderati.

Omoschedasticità ed eteroschedasticità

Infine, vedremo qual è la differenza tra omoschedasticità ed eteroschedasticità, poiché sono due importanti concetti statistici dei modelli di regressione.

L’eteroschedasticità è una caratteristica statistica che implica che i residui del modello di regressione non hanno una varianza costante, quindi la variabilità degli errori non è la stessa in tutto il grafico.

La differenza tra omoschedasticità ed eteroschedasticità è la costanza della varianza dell’errore. L’omoschedasticità implica che la varianza dell’errore sia costante, mentre l’eteroschedasticità implica che la varianza dell’errore non sia costante.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *