Qual è il divario residuo? (definizione & #038; esempio)


La varianza residua (a volte chiamata “varianza inspiegabile”) si riferisce alla varianza in un modello che non può essere spiegata dalle variabili del modello.

Maggiore è la varianza residua di un modello, meno il modello è in grado di spiegare la variazione dei dati.

La varianza residua appare nei risultati di due diversi modelli statistici:

1. ANOVA: utilizzato per confrontare le medie di tre o più gruppi indipendenti.

2. Regressione: utilizzata per quantificare la relazione tra una o più variabili predittive e una variabile di risposta .

Gli esempi seguenti mostrano come interpretare la varianza residua in ciascuno di questi metodi.

Varianza residua nei modelli ANOVA

Ogni volta che adattiamo un modello ANOVA (“analisi della varianza”), ci ritroviamo con una tabella ANOVA simile alla seguente:

Varianza residua nel modello ANOVA

Il valore della varianza residua dal modello ANOVA si trova nella colonna SS (“somma dei quadrati”) per la variazione all’interno del gruppo .

Questo valore è chiamato anche “somma degli errori quadratici” e si calcola utilizzando la seguente formula:

Σ(X ijX j ) 2

Oro:

  • Σ : simbolo greco che significa “somma”
  • X ij : l’ iesima osservazione del gruppo j
  • X j : la media del gruppo j

Nel modello ANOVA sopra, vediamo che la varianza residua è 1100,6.

Per determinare se questa varianza residua è “elevata”, possiamo calcolare la somma media dei quadrati all’interno dei gruppi e la somma media dei quadrati tra i gruppi e trovare il rapporto tra i due, che fornisce il valore F complessivo nella tabella ANOVA.

  • F = MS entra / MS entra
  • F = 96,1/40,76296
  • F = 2.357

Il valore F nella tabella ANOVA sopra è 2,357 e il valore p corrispondente è 0,113848. Poiché questo valore p non è inferiore a α = 0,05, non abbiamo prove sufficienti per rifiutare l’ipotesi nulla.

Ciò significa che non abbiamo prove sufficienti per affermare che la differenza media tra i gruppi che stiamo confrontando sia significativamente diversa.

Questo ci dice che la varianza residua del modello ANOVA è elevata rispetto alla variazione che il modello può effettivamente spiegare.

Varianza residua nei modelli di regressione

In un modello di regressione, la varianza residua è definita come la somma dei quadrati delle differenze tra i punti dati previsti e quelli osservati.

Viene calcolato come segue:

Σ(ŷ i – y i ) 2

Oro:

  • Σ : simbolo greco che significa “somma”
  • ŷ i : i punti dati previsti
  • y i : i punti dati osservati

Quando adattiamo un modello di regressione, di solito otteniamo un risultato simile al seguente:

Varianza residua nel modello di regressione

Il valore della varianza residua dal modello ANOVA può essere trovato nella colonna SS (“somma dei quadrati”) per la variazione residua.

Il rapporto tra variazione residua e variazione totale nel modello ci dice la percentuale di variazione nella variabile di risposta che non può essere spiegata dalle variabili predittive nel modello.

Ad esempio, nella tabella sopra, calcoleremo questa percentuale come segue:

  • Variazione inspiegabile = SS residuo / SS totale
  • Variazione inspiegabile = 5,9024 / 174,5
  • Variazione inspiegabile = 0,0338

Questo valore può essere calcolato anche utilizzando la seguente formula:

  • Variazione inspiegabile = 1 – R 2
  • Variazione inspiegabile = 1 – 0,96617
  • Variazione inspiegabile = 0,0338

Il valore R quadrato del modello ci dice la percentuale di variazione nella variabile di risposta che può essere spiegata dalla variabile predittore.

Pertanto, minore è la variazione inspiegabile, tanto più capace è un modello di utilizzare le variabili predittive per spiegare la variazione nella variabile di risposta.

Risorse addizionali

Qual è un buon valore R quadrato?
Come calcolare R quadrato in Excel
Come calcolare R-quadrato in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *