5 esempi di valori anomali nella vita reale
Un valore anomalo è un punto dati anormalmente lontano da altri valori in un set di dati.
Spesso definiamo un punto dati come valore anomalo se è 1,5 volte l’intervallo interquartile al di sopra del terzo quartile o 1,5 volte l’intervallo interquartile al di sotto del primo quartile di un set di dati.
Nota : l’intervallo interquartile è la differenza tra il terzo quartile (75° percentile) e il primo quartile (25° percentile) di un set di dati.
Gli scenari seguenti mostrano esempi di valori anomali in situazioni reali.
Esempio 1: valori anomali del reddito
Uno scenario concreto in cui spesso compaiono anomalie è quello della distribuzione del reddito.
Ad esempio, il 25° percentile (Q1) del reddito annuo in un determinato paese potrebbe essere di $ 15.000 all’anno e il 75° percentile (Q3) potrebbe essere di $ 120.000 all’anno.
L’intervallo interquartile (IQR) verrebbe calcolato come segue: $ 120.000 – $ 15.000 = $ 105.000.
Ciò significa che chiunque il cui reddito non rientri nei seguenti limiti sarebbe considerato un valore anomalo:
- Limite inferiore : Q1 – 1,5*IQR = $ 15.000 – 1,5*$ 105.000 = -$ 142.500
- Limite superiore : Q3 + 1,5*IQR = $ 120.000 + 1,5*$ 105.000 = $ 277.500
Qualcuno come Elon Musk, il cui patrimonio netto ammonta a trilioni di dollari, sarebbe considerato un valore anomalo in termini di reddito annuo.
Nota : il valore dei valori anomali oltre il limite inferiore non è sempre significativo, ad esempio non è possibile guadagnare un reddito annuo negativo.
Esempio 2: valori anomali di apnea
Un altro scenario del mondo reale in cui spesso compaiono valori anomali è l’apnea.
Ad esempio, il 25° percentile (Q1) per quanto tempo gli individui possono trattenere il respiro è di circa 15 secondi, mentre il 75° percentile (Q3) è di circa 75 secondi.
L’intervallo interquartile (IQR) verrebbe calcolato come segue: 75 – 15 = 60.
Ciò significa che chiunque sia in grado di trattenere il respiro al di fuori dei seguenti limiti sarebbe considerato un valore anomalo:
- Limite inferiore : Q1 – 1,5*IQR = 15 – 1,5*60 = -75 secondi
- Limite superiore : Q3 + 1,5*IQR = 75 + 1,5*60 = 165 secondi
Tutti gli apneisti che riescono a trattenere il respiro per 10 minuti o più sarebbero considerati valori anomali perché possono trattenere il respiro per molto più tempo di 165 secondi.
Esempio 3: valori anomali nella dimensione degli animali
Un altro scenario reale in cui spesso compaiono valori anomali è la dimensione degli animali.
Ad esempio, il 25° percentile (Q1) dell’altezza del cavallo è di circa 5 piedi e il 75° percentile (Q3) è di circa 5,5 piedi.
L’intervallo interquartile (IQR) verrebbe calcolato come segue: 5,5 – 5 = 0,5 piedi.
Ciò significa che qualsiasi cavallo la cui taglia non rientra nei seguenti limiti sarebbe considerato un valore anomalo:
- Limite inferiore : Q1 – 1,5*IQR = 5 – 1,5*0,5 = 4,25 piedi
- Limite superiore : Q3 + 1,5*IQR = 5 + 1,5*0,5 = 5,75 piedi
Secondo il Guinness World Records , il record per il cavallo più alto di tutti i tempi è di poco più di 7 piedi. Poiché questo valore è superiore al limite superiore di 5,75 piedi, questo cavallo sarebbe chiaramente considerato un valore anomalo.
Esempio 4: valori anomali nella vendita di biglietti del cinema
Un altro scenario reale in cui spesso compaiono valori anomali è quello della vendita dei biglietti del cinema.
Ad esempio, il 25° percentile (Q1) delle vendite lorde di biglietti per il cinema è di circa 2 milioni di dollari e il 75° percentile (Q3) è di circa 15 milioni di dollari.
L’intervallo interquartile (IQR) verrebbe calcolato come segue: $ 15 milioni – $ 2 milioni = $ 13 milioni.
Ciò significa che qualsiasi film le cui vendite lorde non rientrano nei seguenti limiti sarebbe considerato un valore anomalo:
- Limite inferiore : T1 – 1,5*IQR = $2 milioni – 1,5*$13 milioni = -$17,5 milioni
- Limite superiore : T3 + 1,5*IQR = 15 milioni di dollari + 1,5*13 milioni di dollari = 34,5 milioni di dollari
La maggior parte dei film di Star Wars ha incassato ben oltre 34,5 milioni di dollari, rendendoli dei valori anomali in termini di vendita di biglietti.
Esempio 5: valori anomali nei punti segnati per partita
Un’altra area del mondo reale in cui spesso compaiono valori anomali è lo sport professionistico.
Ad esempio, il 25° percentile (Q1) dei punti segnati dai giocatori NBA è di circa 5 punti a partita e il 75° percentile (Q3) è di circa 15 punti a partita.
L’intervallo interquartile (IQR) verrebbe calcolato come segue: 15 – 5 = 10 punti.
Ciò significa che qualsiasi giocatore la cui media non rientra nei seguenti limiti sarebbe considerato un valore anomalo:
- Limite inferiore : Q1 – 1,5*IQR = 5 – 1,5*10 = -10 punti
- Limite superiore : Q3 + 1,5*IQR = 15 + 1,5*10 = 30 punti
In molte stagioni NBA , il giocatore con il punteggio più alto in genere segna poco più di 30 punti a partita, rendendolo un valore anomalo.
Risorse addizionali
I seguenti tutorial spiegano come trovare valori anomali nei set di dati utilizzando vari software statistici:
Come trovare valori anomali in Excel
Come trovare valori anomali in R
Come trovare valori anomali in Python
Come trovare valori anomali in SPSS