Criterio chauvenet: definizione ed esempio


Un valore anomalo è un’osservazione anormalmente distante da altri valori in un set di dati. I valori anomali possono essere problematici perché possono influenzare i risultati di un’analisi.

Un modo per identificare i valori anomali in un set di dati è utilizzare il criterio Chauvenet , che utilizza il seguente processo:

1. Per ogni singolo valore x i nel set di dati, calcolare la deviazione dalla media come segue:

Deviazione = |x ix | /S

dove x è la media campionaria e s è la deviazione standard campionaria.

2. Confrontare le deviazioni di ogni singolo valore con i valori critici nella tabella dei criteri Chauvenet di seguito. Per i singoli valori dei dati con deviazioni maggiori di quelli presenti nella tabella, segnalare questi valori dei dati come valori anomali.

Tabella dei criteri di Chauvenet

Il criterio di Chauvenet: un esempio

Supponiamo di avere il seguente set di dati di 15 valori:

La media campionaria per questo set di dati è x = 17.067 e la deviazione standard del campione è s = 10.096 . Per ogni singolo valore dei dati, possiamo calcolare la sua deviazione come segue:

Deviazione = |x ix | /S

Per esempio:

  • Il primo valore dei dati avrebbe una deviazione di |4 – 17.067| /10.096 = 1.294 .
  • Il primo valore dei dati avrebbe una deviazione di |6 – 17.067| /10.096 = 1.096 .

E così via.

Possiamo utilizzare la stessa formula per calcolare la deviazione di ogni singolo valore di dati:

Esempio di criterio di Chauvenet

Possiamo quindi fare riferimento alla tabella dei criteri di Chauvenet e notare che il valore critico che corrisponde a una dimensione del campione di n=15 è 2.128 . Pertanto, qualsiasi valore con una deviazione maggiore di 2,128 può essere considerato un valore anomalo.

Risulta che il valore 42 ha una deviazione maggiore di 2.128:

Esempio del criterio di Chauvenet per il rilevamento dei valori anomali

Pertanto, il valore 42 è l’unico valore anomalo in questo set di dati.

Precauzioni riguardanti l’uso del criterio Chauvenet

Il criterio Chauvenet presuppone che i valori in un set di dati siano distribuiti normalmente . Se questo presupposto non è soddisfatto, l’utilizzo del criterio di Chauvenet per identificare i valori anomali probabilmente non è valido.

Se si utilizza questo metodo e si scopre che un valore è un valore anomalo, è necessario innanzitutto verificare che il valore non sia il risultato di un errore di immissione dei dati. A volte i dati vengono semplicemente inseriti in modo errato.

Se il valore è davvero un valore anomalo, puoi scegliere di rimuoverlo se avrà un impatto significativo sull’analisi complessiva. Assicurati solo di menzionare che hai rimosso un valore anomalo quando riporti i risultati.

Inoltre, questo metodo deve essere utilizzato solo una volta su un determinato set di dati. Ad esempio, supponiamo di utilizzare questo criterio per identificare il valore 42 come valore anomalo nell’esempio precedente e rimuovere tale valore dal set di dati.

Non dovremmo quindi ricalcolare la media campionaria e la deviazione standard campionaria e calcolare nuovamente le deviazioni per trovare più valori anomali.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *