Normalizzazione del punteggio z: definizione ed esempi
La normalizzazione del punteggio Z si riferisce al processo di normalizzazione di ciascun valore in un set di dati in modo tale che la media di tutti i valori sia 0 e la deviazione standard sia 1.
Usiamo la seguente formula per eseguire la normalizzazione del punteggio z su ciascun valore in un set di dati:
Nuovo valore = (x – μ) / σ
Oro:
- x : valore originale
- μ : Media dei dati
- σ : Deviazione standard dei dati
L’esempio seguente mostra come eseguire nella pratica la normalizzazione del punteggio z su un set di dati.
Esempio: esecuzione della normalizzazione del punteggio Z
Supponiamo di avere il seguente set di dati:
Usando una calcolatrice, possiamo vedere che la media del set di dati è 21,2 e la deviazione standard è 29,8 .
Per eseguire la normalizzazione del punteggio z sul primo valore nel set di dati, possiamo utilizzare la seguente formula:
- Nuovo valore = (x – μ) / σ
- Nuovo valore = (3 – 21,2) / 29,8
- Nuovo valore = -0,61
Possiamo utilizzare questa formula per eseguire la normalizzazione del punteggio z su ciascun valore nel set di dati:
La media dei valori normalizzati è 0 e la deviazione standard dei valori normalizzati è 1 .
I valori normalizzati rappresentano il numero di deviazioni standard tra il valore originale e la media.
Per esempio:
- Il primo valore nel set di dati è 0,61 deviazioni standard sotto la media.
- Il secondo valore nel set di dati è 0,54 deviazioni standard sotto la media.
- …
- L’ultimo valore nel set di dati è 3,79 deviazioni standard sopra la media.
Il vantaggio di eseguire questo tipo di normalizzazione è che l’ovvio valore anomalo nel set di dati (134) è stato trasformato in modo tale da non essere più un enorme valore anomalo.
Se poi utilizziamo questo set di dati per adattare un qualche tipo di modello di apprendimento automatico , il valore anomalo non avrà più la stessa influenza che potrebbe avere sull’adattamento del modello.
Risorse addizionali
Le seguenti esercitazioni forniscono informazioni aggiuntive sulle diverse tecniche di normalizzazione:
Standardizzazione o normalizzazione: qual è la differenza?
Come normalizzare i dati tra 0 e 1
Come normalizzare i dati tra 0 e 100