Come calcolare i residui standardizzati in excel


Un residuo è la differenza tra un valore osservato e un valore previsto in un modello di regressione .

Viene calcolato come segue:

Residuo = Valore osservato – Valore previsto

Se tracciassimo i valori osservati e sovrapponessimo la linea di regressione adattata, i residui per ciascuna osservazione sarebbero la distanza verticale tra l’osservazione e la linea di regressione:

Esempio di residuo in statistica

Un tipo di residuo che utilizziamo spesso per identificare i valori anomali in un modello di regressione è chiamato residuo standardizzato .

Viene calcolato come segue:

r i = e i / s(e i ) = e i / RSE√ 1-h ii

Oro:

  • e i : L’iesimo residuo
  • RSE: errore standard residuo del modello
  • h ii : Il sorgere dell’i -esima osservazione

In pratica, spesso consideriamo come un valore anomalo qualsiasi residuo standardizzato il cui valore assoluto sia maggiore di 3.

Questo tutorial fornisce un esempio passo passo di come calcolare i residui standardizzati in Excel.

Passaggio 1: inserisci i dati

Innanzitutto, inseriremo i valori da un piccolo set di dati in Excel:

Passaggio 2: calcolare i residui

Successivamente, passeremo alla scheda Dati lungo la barra multifunzione superiore e faremo clic su Analisi dati nel gruppo Analisi :

Se non hai già installato questo componente aggiuntivo, consulta questo tutorial per sapere come. È facile da installare e completamente gratuito.

Dopo aver fatto clic su Analisi dei dati, fare clic sull’opzione che dice Regressione , quindi fare clic su OK . Nella nuova finestra che appare, inserisci le seguenti informazioni e fai clic su OK :

Il residuo per ciascuna osservazione apparirà nel risultato:

Residui in Excel

Copia e incolla questi residui in una nuova colonna accanto ai dati originali:

Passaggio 3: calcolare la leva finanziaria

Successivamente, dobbiamo calcolare la leva di ciascuna osservazione.

L’immagine seguente mostra come eseguire questa operazione:

Sfruttare il calcolo in Excel per le statistiche

Ecco le formule utilizzate nelle diverse celle:

  • B14: =COUNT(B2:B13)
  • B15: = MEDIA (B2: B13)
  • B16: =DEVSQ(B2:B13)
  • E2: =1/$B$14+(B2-$B$15)^2/$B$16

Passaggio 4: calcolare i residui standardizzati

Infine possiamo calcolare i residui standardizzati utilizzando la formula:

r io = e io / RSE√ 1-h ii

La CSR del modello può essere trovata nei risultati del modello precedente. Risulta essere 4.44 :

Pertanto, possiamo utilizzare la seguente formula per calcolare il residuo standardizzato per ciascuna osservazione:

Residui standardizzati in Excel

Dai risultati, possiamo vedere che nessuno dei residui standardizzati supera il valore assoluto di 3. Pertanto, nessuna delle osservazioni sembra essere un valore anomalo.

Va notato che in alcuni casi i ricercatori considerano come valori anomali le osservazioni i cui residui standardizzati superano il valore assoluto di 2.

Sta a te decidere se utilizzare un valore assoluto pari a 2 o 3 come soglia per i valori anomali, a seconda del problema specifico su cui stai lavorando.

Risorse addizionali

Cosa sono i residui?
Cosa sono i residui standardizzati?
Introduzione alla regressione lineare multipla

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *