Che cos'è un grafico dei residui/leva? (definizione & #038; esempio)
Un grafico dei residui rispetto alla leva finanziaria è un tipo di grafico diagnostico che ci consente di identificare le osservazioni influenti in un modello di regressione.
Ecco come appare questo tipo di grafico nel linguaggio di programmazione statistica R:
Ogni osservazione nel set di dati viene visualizzata come un singolo punto nel grafico. L’asse x mostra la leva finanziaria di ciascun punto e l’asse y mostra il residuo standardizzato di ciascun punto.
La leva finanziaria si riferisce alla misura in cui i coefficienti del modello di regressione cambierebbero se una particolare osservazione venisse rimossa dal set di dati.
Le osservazioni con leva elevata hanno una forte influenza sui coefficienti del modello di regressione. Se rimuovessimo queste osservazioni, i coefficienti del modello cambierebbero in modo significativo.
I residui standardizzati si riferiscono alla differenza standardizzata tra un valore previsto per un’osservazione e il valore effettivo dell’osservazione.
Va notato che un’osservazione può avere un valore assoluto elevato per un residuo standardizzato, ma un valore basso per la leva finanziaria.
Come interpretare un grafico dei residui rispetto alla leva finanziaria
Se un punto su questo grafico non rientra nella distanza di Cook (le linee tratteggiate rosse), allora è considerato un’osservazione influente.
Facciamo riferimento al grafico dei residui rispetto alla leva finanziaria mostrato in precedenza:
Nell’esempio sopra, possiamo vedere che l’osservazione n. 10 è la più vicina al limite della distanza di Cook, ma non va oltre la linea tratteggiata. Ciò significa che non ci sono punti influenti nel nostro modello di regressione.
Tuttavia, supponiamo di avere il seguente grafico residuo/leva:
Possiamo vedere che l’osservazione n. 1 nell’angolo in alto a destra è fuori dalle linee tratteggiate rosse. Ciò indica che si tratta di un punto di influenza .
Ciò significa che se rimuovessimo questa osservazione dal nostro set di dati e adattassimo nuovamente il modello di regressione, i coefficienti del modello cambierebbero in modo significativo.
Come gestire le osservazioni influenti
Se crei un grafico dei residui rispetto alla leva finanziaria per un modello e vedi che una o più osservazioni sono identificate come influenti, puoi fare diverse cose:
1. Verificare che l’osservazione non sia un errore.
Prima di intraprendere qualsiasi azione, è necessario verificare che le osservazioni influenti non siano il risultato di un errore di immissione dei dati o di altri eventi strani.
2. Prova ad adattare un altro modello di regressione.
Osservazioni influenti potrebbero indicare che il modello specificato non si adatta bene ai dati. In questo caso, puoi provare un modello di regressione polinomiale o un modello non lineare.
3. Rimuovi i commenti influenti.
Infine, potresti decidere di rimuovere semplicemente le osservazioni influenti se il modello specificato sembra adattarsi bene ai dati, ad eccezione di una o due osservazioni influenti.
Risorse addizionali
Le esercitazioni seguenti forniscono informazioni aggiuntive su come utilizzare i residui per valutare l’adattamento dei modelli di regressione.
Cosa sono i residui in statistica?
Cosa sono i residui standardizzati?
Come interpretare i grafici diagnostici in R