Come trovare facilmente valori anomali in fogli google


Un valore anomalo è un’osservazione anormalmente distante da altri valori in un set di dati.

Spesso definiamo un’osservazione come un valore anomalo se è 1,5 volte l’intervallo interquartile al di sopra del terzo quartile o 1,5 volte l’intervallo interquartile al di sotto del primo quartile.

Nota: l’intervallo interquartile è la differenza tra il terzo quartile (75° percentile) e il primo quartile (25° percentile) di un set di dati. Misura la distribuzione media del 50% dei valori.

Il seguente esempio passo passo mostra come utilizzare questa formula per trovare valori anomali in un set di dati in Fogli Google.

Passaggio 1: inserisci i dati

Innanzitutto, inseriamo i valori dal seguente set di dati in Fogli Google:

Passaggio 2: calcolare l’intervallo interquartile

Successivamente, calcoliamo il primo quartile, il terzo quartile e l’intervallo interquartile del set di dati:

Passaggio 3: identificare i valori anomali

Quindi possiamo utilizzare la seguente formula per assegnare un “1” a qualsiasi valore anomalo nel set di dati:

 = IF ( A2 < $B$18 - $B$20 * 1.5 , 1 , IF ( A2 > $B$19 + $B$20 * 1.5 , 1 , 0 ) )

Questa formula controlla se un’osservazione è 1,5 volte l’intervallo interquartile sopra il terzo quartile o 1,5 volte l’intervallo interquartile sotto il primo quartile.

Se una delle due è vera, all’osservazione viene assegnato un “1” per designarla come valore anomalo.

Lo screenshot seguente mostra come utilizzare questa formula nella pratica:

Trova valori anomali in Fogli Google

Vediamo che solo un valore nel nostro set di dati risulta essere un valore anomalo: 164 .

Come gestire i valori anomali

Se nei tuoi dati è presente un valore anomalo, hai diverse opzioni:

1. Assicurarsi che il valore anomalo non sia il risultato di un errore di immissione dei dati.

A volte i dati semplici vengono salvati in modo errato. Se è presente un valore anomalo, verificare innanzitutto che il valore sia stato immesso correttamente e che non si tratti di un errore.

2. Assegnare un nuovo valore al valore anomalo .

Se il valore anomalo è il risultato di un errore di immissione dei dati, puoi decidere di assegnargli un nuovo valore come la media o la mediana del set di dati.

3. Rimuovere il valore anomalo.

Se il valore è davvero un valore anomalo, puoi scegliere di rimuoverlo se avrà un impatto significativo sull’analisi complessiva. Assicurati solo di menzionare nel tuo rapporto finale che hai rimosso un valore anomalo.

Risorse addizionali

I seguenti tutorial spiegano come rimuovere i valori anomali in altri software statistici:

Come rimuovere gli outlier in R
Come rimuovere i valori anomali in Python
Come rimuovere i valori anomali in SPSS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *