Come eseguire il tester di grubbs in excel


Il test di Grubbs è un test statistico che può essere utilizzato per identificare la presenza di un valore anomalo in un set di dati. Per utilizzare questo test, il set di dati che stai analizzando deve essere distribuito approssimativamente normalmente e, idealmente, deve contenere almeno 7 osservazioni.

Nota: se ritieni che siano presenti più valori anomali nel set di dati, dovresti utilizzare invece il test generalizzato del divario estremo degli studenti per i valori anomali .

Se si ritiene che il valore massimo nel set di dati sia un valore anomalo, la statistica del test viene calcolata come segue:

G = (x maxx ) / s

Se si ritiene che il valore minimo nel set di dati sia un valore anomalo, la statistica del test viene calcolata come segue:

G = ( x – x min ) / s

E se non sei sicuro che il valore massimo o minimo del set di dati sia un valore anomalo e desideri eseguire un test a due code, la statistica del test viene calcolata come segue:

G = max|x ix | /S

dove x è la media campionaria e s è la deviazione standard campionaria.

Il valore critico del test viene calcolato come segue:

G critico = (n-1)t critico / √[n(n-2 + t 2 critico )]

dove t critico è il valore critico della distribuzione t con n-2 gradi di libertà e il livello di significatività è α/n per un test unilaterale e α/(2n) per un test bilaterale.

Esempio: test di Grubbs in Excel

Determina se il valore 60 è un valore anomalo nel seguente set di dati:

Passaggio 1: innanzitutto dobbiamo assicurarci che i dati siano distribuiti in modo approssimativamente normale. Per fare ciò, possiamo creare un istogramma per verificare che la distribuzione sia approssimativamente a campana. La schermata seguente mostra come creare un istogramma in Excel utilizzando il Data Analysis ToolPak :

Dall’istogramma possiamo vedere che i dati sono distribuiti approssimativamente normalmente. Ciò significa che possiamo effettuare il test di Grubbs.

Istogramma in Excel

Passaggio 2: Successivamente, eseguiremo il test di Grubbs per determinare se il valore 60 è veramente un valore anomalo nel set di dati. Lo screenshot qui sotto mostra le formule da utilizzare per eseguire il test di Grubbs:

La statistica del test, G , nella cella D4 è 3.603219 .

Il valore critico, G critical , nella cella D11 è 2.556581 . Poiché la statistica del test è maggiore del valore critico, ciò significa che il valore 60 è effettivamente un valore anomalo in questo set di dati.

Cosa fare se viene identificato un valore anomalo

Se il test di Grubbs identifica un valore anomalo nel set di dati, hai diverse opzioni:

  • Ricontrolla per assicurarti che il valore non sia un errore di battitura o di immissione dei dati. A volte i valori che appaiono come valori anomali nei set di dati sono semplicemente errori di battitura effettuati da un individuo durante l’immissione dei dati. Torna indietro e verifica che il valore sia stato inserito correttamente prima di prendere ulteriori decisioni.
  • Assegnare un nuovo valore al valore anomalo . Se il valore anomalo risulta essere il risultato di un errore di battitura o di immissione dei dati, puoi decidere di assegnargli un nuovo valore, come la media o la mediana del set di dati.
  • Rimuovi il valore anomalo. Se il valore è davvero un valore anomalo, puoi scegliere di rimuoverlo se avrà un impatto significativo sull’analisi complessiva.

Qualunque cosa tu decida di fare con il valore anomalo, assicurati di prenderne nota quando presenti le conclusioni finali della tua analisi.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *