Come calcolare i punteggi z modificati in excel
Nelle statistiche, un punteggio z modificato viene calcolato come segue:
Punteggio z modificato = 0,6745 (x i – x̃) / MAD
Oro:
- x i : un singolo valore di dati
- x̃: la mediana del set di dati
- MAD: la deviazione assoluta mediana del set di dati
Un punteggio z modificato è più robusto di un punteggio z normale perché utilizza la mediana nella sua formula invece della media, che è nota per essere influenzata da valori anomali .
Iglewicz e Hoaglin raccomandano che i valori con punteggi z modificati inferiori a -3,5 o superiori a 3,5 siano etichettati come potenziali valori anomali.
Il seguente esempio passo passo mostra come calcolare i punteggi z modificati per un determinato set di dati in Excel.
Passaggio 1: creare i dati
Innanzitutto, creeremo il seguente set di dati contenente 16 valori:
Passaggio 2: calcolare la mediana
Successivamente, calcoleremo la mediana del set di dati:
La media risulta essere 16 .
Passaggio 3: calcolare la differenza assoluta tra ciascun valore e la mediana
Successivamente, calcoleremo la differenza assoluta tra ciascun valore e la mediana:
La differenza assoluta tra il primo valore dei dati e la mediana risulta essere 16.
Successivamente, fai clic sulla cella B2. Quindi passa il mouse sull’angolo in basso a destra della cella finché non viene visualizzata una piccola croce ( + ).
Fai doppio clic sulla croce per copiare e incollare questa formula in tutte le celle rimanenti nella colonna:
Passaggio 4: calcolare la deviazione mediana assoluta
Successivamente, utilizzeremo la seguente formula per calcolare la deviazione assoluta mediana del set di dati:
La deviazione mediana assoluta risulta essere 8 .
Passaggio 5: trova il punteggio Z modificato per ciascun valore di dati
Infine, possiamo calcolare il punteggio z modificato per ciascun valore di dati utilizzando la seguente formula:
Punteggio z modificato = 0,6745 (x i – x̃) / MAD
Ad esempio, il punteggio z modificato per il primo valore dei dati viene calcolato come segue:
Successivamente, fai clic sulla cella C2. Quindi passa il mouse sull’angolo in basso a destra della cella finché non viene visualizzata una piccola croce ( + ).
Fai doppio clic sulla croce per copiare e incollare questa formula in tutte le celle rimanenti nella colonna:
Possiamo vedere che nessun valore nel set di dati ha un punteggio z modificato inferiore a -3,5 o maggiore di 3,5, quindi non etichetteremo alcun valore in questo set di dati come potenziale valore anomalo.
Come gestire i valori anomali
Se nel set di dati è presente un valore anomalo, hai diverse opzioni:
- Assicurarsi che il valore anomalo non sia il risultato di un errore di immissione dei dati. A volte un individuo inserisce semplicemente il valore dei dati errato durante il salvataggio dei dati. Se è presente un valore anomalo, verificare innanzitutto che il valore sia stato immesso correttamente e che non si tratti di un errore.
- Assegnare un nuovo valore al valore anomalo . Se l’outlier risulta essere il risultato di un errore di immissione dei dati, puoi decidere di assegnargli un nuovo valore come la media o la mediana del set di dati.
- Rimuovi il valore anomalo. Se il valore è davvero un valore anomalo, puoi scegliere di rimuoverlo se avrà un impatto significativo sull’analisi complessiva. Assicurati solo di menzionare nel rapporto finale o nell’analisi che hai rimosso un valore anomalo.
Risorse addizionali
Come calcolare i punteggi Z in Excel
Come calcolare l’intervallo interquartile (IQR) in Excel
Come calcolare la gamma media in Excel