Come calcolare i residui standardizzati in excel
Un residuo è la differenza tra un valore osservato e un valore previsto in un modello di regressione .
Viene calcolato come segue:
Residuo = Valore osservato – Valore previsto
Se tracciassimo i valori osservati e sovrapponessimo la linea di regressione adattata, i residui per ciascuna osservazione sarebbero la distanza verticale tra l’osservazione e la linea di regressione:
Un tipo di residuo che utilizziamo spesso per identificare i valori anomali in un modello di regressione è chiamato residuo standardizzato .
Viene calcolato come segue:
r i = e i / s(e i ) = e i / RSE√ 1-h ii
Oro:
- e i : L’iesimo residuo
- RSE: errore standard residuo del modello
- h ii : Il sorgere dell’i -esima osservazione
In pratica, spesso consideriamo come un valore anomalo qualsiasi residuo standardizzato il cui valore assoluto sia maggiore di 3.
Questo tutorial fornisce un esempio passo passo di come calcolare i residui standardizzati in Excel.
Passaggio 1: inserisci i dati
Innanzitutto, inseriremo i valori da un piccolo set di dati in Excel:
Passaggio 2: calcolare i residui
Successivamente, passeremo alla scheda Dati lungo la barra multifunzione superiore e faremo clic su Analisi dati nel gruppo Analisi :
Se non hai già installato questo componente aggiuntivo, consulta questo tutorial per sapere come. È facile da installare e completamente gratuito.
Dopo aver fatto clic su Analisi dei dati, fare clic sull’opzione che dice Regressione , quindi fare clic su OK . Nella nuova finestra che appare, inserisci le seguenti informazioni e fai clic su OK :
Il residuo per ciascuna osservazione apparirà nel risultato:
Copia e incolla questi residui in una nuova colonna accanto ai dati originali:
Passaggio 3: calcolare la leva finanziaria
Successivamente, dobbiamo calcolare la leva di ciascuna osservazione.
L’immagine seguente mostra come eseguire questa operazione:
Ecco le formule utilizzate nelle diverse celle:
- B14: =COUNT(B2:B13)
- B15: = MEDIA (B2: B13)
- B16: =DEVSQ(B2:B13)
- E2: =1/$B$14+(B2-$B$15)^2/$B$16
Passaggio 4: calcolare i residui standardizzati
Infine possiamo calcolare i residui standardizzati utilizzando la formula:
r io = e io / RSE√ 1-h ii
La CSR del modello può essere trovata nei risultati del modello precedente. Risulta essere 4.44 :
Pertanto, possiamo utilizzare la seguente formula per calcolare il residuo standardizzato per ciascuna osservazione:
Dai risultati, possiamo vedere che nessuno dei residui standardizzati supera il valore assoluto di 3. Pertanto, nessuna delle osservazioni sembra essere un valore anomalo.
Va notato che in alcuni casi i ricercatori considerano come valori anomali le osservazioni i cui residui standardizzati superano il valore assoluto di 2.
Sta a te decidere se utilizzare un valore assoluto pari a 2 o 3 come soglia per i valori anomali, a seconda del problema specifico su cui stai lavorando.
Risorse addizionali
Cosa sono i residui?
Cosa sono i residui standardizzati?
Introduzione alla regressione lineare multipla