5 esempi di valori anomali nella vita reale


Un valore anomalo è un punto dati anormalmente lontano da altri valori in un set di dati.

Spesso definiamo un punto dati come valore anomalo se è 1,5 volte l’intervallo interquartile al di sopra del terzo quartile o 1,5 volte l’intervallo interquartile al di sotto del primo quartile di un set di dati.

Nota : l’intervallo interquartile è la differenza tra il terzo quartile (75° percentile) e il primo quartile (25° percentile) di un set di dati.

Gli scenari seguenti mostrano esempi di valori anomali in situazioni reali.

Esempio 1: valori anomali del reddito

Uno scenario concreto in cui spesso compaiono anomalie è quello della distribuzione del reddito.

Ad esempio, il 25° percentile (Q1) del reddito annuo in un determinato paese potrebbe essere di $ 15.000 all’anno e il 75° percentile (Q3) potrebbe essere di $ 120.000 all’anno.

L’intervallo interquartile (IQR) verrebbe calcolato come segue: $ 120.000 – $ 15.000 = $ 105.000.

Ciò significa che chiunque il cui reddito non rientri nei seguenti limiti sarebbe considerato un valore anomalo:

  • Limite inferiore : Q1 – 1,5*IQR = $ 15.000 – 1,5*$ 105.000 = -$ 142.500
  • Limite superiore : Q3 + 1,5*IQR = $ 120.000 + 1,5*$ 105.000 = $ 277.500

Qualcuno come Elon Musk, il cui patrimonio netto ammonta a trilioni di dollari, sarebbe considerato un valore anomalo in termini di reddito annuo.

Nota : il valore dei valori anomali oltre il limite inferiore non è sempre significativo, ad esempio non è possibile guadagnare un reddito annuo negativo.

Esempio 2: valori anomali di apnea

Un altro scenario del mondo reale in cui spesso compaiono valori anomali è l’apnea.

Ad esempio, il 25° percentile (Q1) per quanto tempo gli individui possono trattenere il respiro è di circa 15 secondi, mentre il 75° percentile (Q3) è di circa 75 secondi.

L’intervallo interquartile (IQR) verrebbe calcolato come segue: 75 – 15 = 60.

Ciò significa che chiunque sia in grado di trattenere il respiro al di fuori dei seguenti limiti sarebbe considerato un valore anomalo:

  • Limite inferiore : Q1 – 1,5*IQR = 15 – 1,5*60 = -75 secondi
  • Limite superiore : Q3 + 1,5*IQR = 75 + 1,5*60 = 165 secondi

Tutti gli apneisti che riescono a trattenere il respiro per 10 minuti o più sarebbero considerati valori anomali perché possono trattenere il respiro per molto più tempo di 165 secondi.

Esempio 3: valori anomali nella dimensione degli animali

Un altro scenario reale in cui spesso compaiono valori anomali è la dimensione degli animali.

Ad esempio, il 25° percentile (Q1) dell’altezza del cavallo è di circa 5 piedi e il 75° percentile (Q3) è di circa 5,5 piedi.

L’intervallo interquartile (IQR) verrebbe calcolato come segue: 5,5 – 5 = 0,5 piedi.

Ciò significa che qualsiasi cavallo la cui taglia non rientra nei seguenti limiti sarebbe considerato un valore anomalo:

  • Limite inferiore : Q1 – 1,5*IQR = 5 – 1,5*0,5 = 4,25 piedi
  • Limite superiore : Q3 + 1,5*IQR = 5 + 1,5*0,5 = 5,75 piedi

Secondo il Guinness World Records , il record per il cavallo più alto di tutti i tempi è di poco più di 7 piedi. Poiché questo valore è superiore al limite superiore di 5,75 piedi, questo cavallo sarebbe chiaramente considerato un valore anomalo.

Esempio 4: valori anomali nella vendita di biglietti del cinema

Un altro scenario reale in cui spesso compaiono valori anomali è quello della vendita dei biglietti del cinema.

Ad esempio, il 25° percentile (Q1) delle vendite lorde di biglietti per il cinema è di circa 2 milioni di dollari e il 75° percentile (Q3) è di circa 15 milioni di dollari.

L’intervallo interquartile (IQR) verrebbe calcolato come segue: $ 15 milioni – $ 2 milioni = $ 13 milioni.

Ciò significa che qualsiasi film le cui vendite lorde non rientrano nei seguenti limiti sarebbe considerato un valore anomalo:

  • Limite inferiore : T1 – 1,5*IQR = $2 milioni – 1,5*$13 milioni = -$17,5 milioni
  • Limite superiore : T3 + 1,5*IQR = 15 milioni di dollari + 1,5*13 milioni di dollari = 34,5 milioni di dollari

La maggior parte dei film di Star Wars ha incassato ben oltre 34,5 milioni di dollari, rendendoli dei valori anomali in termini di vendita di biglietti.

Esempio 5: valori anomali nei punti segnati per partita

Un’altra area del mondo reale in cui spesso compaiono valori anomali è lo sport professionistico.

Ad esempio, il 25° percentile (Q1) dei punti segnati dai giocatori NBA è di circa 5 punti a partita e il 75° percentile (Q3) è di circa 15 punti a partita.

L’intervallo interquartile (IQR) verrebbe calcolato come segue: 15 – 5 = 10 punti.

Ciò significa che qualsiasi giocatore la cui media non rientra nei seguenti limiti sarebbe considerato un valore anomalo:

  • Limite inferiore : Q1 – 1,5*IQR = 5 – 1,5*10 = -10 punti
  • Limite superiore : Q3 + 1,5*IQR = 15 + 1,5*10 = 30 punti

In molte stagioni NBA , il giocatore con il punteggio più alto in genere segna poco più di 30 punti a partita, rendendolo un valore anomalo.

Risorse addizionali

I seguenti tutorial spiegano come trovare valori anomali nei set di dati utilizzando vari software statistici:

Come trovare valori anomali in Excel
Come trovare valori anomali in R
Come trovare valori anomali in Python
Come trovare valori anomali in SPSS

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *