Normalizzazione del punteggio z: definizione ed esempi


La normalizzazione del punteggio Z si riferisce al processo di normalizzazione di ciascun valore in un set di dati in modo tale che la media di tutti i valori sia 0 e la deviazione standard sia 1.

Usiamo la seguente formula per eseguire la normalizzazione del punteggio z su ciascun valore in un set di dati:

Nuovo valore = (x – μ) / σ

Oro:

  • x : valore originale
  • μ : Media dei dati
  • σ : Deviazione standard dei dati

L’esempio seguente mostra come eseguire nella pratica la normalizzazione del punteggio z su un set di dati.

Esempio: esecuzione della normalizzazione del punteggio Z

Supponiamo di avere il seguente set di dati:

Usando una calcolatrice, possiamo vedere che la media del set di dati è 21,2 e la deviazione standard è 29,8 .

Per eseguire la normalizzazione del punteggio z sul primo valore nel set di dati, possiamo utilizzare la seguente formula:

  • Nuovo valore = (x – μ) / σ
  • Nuovo valore = (3 – 21,2) / 29,8
  • Nuovo valore = -0,61

Possiamo utilizzare questa formula per eseguire la normalizzazione del punteggio z su ciascun valore nel set di dati:

La media dei valori normalizzati è 0 e la deviazione standard dei valori normalizzati è 1 .

I valori normalizzati rappresentano il numero di deviazioni standard tra il valore originale e la media.

Per esempio:

  • Il primo valore nel set di dati è 0,61 deviazioni standard sotto la media.
  • Il secondo valore nel set di dati è 0,54 deviazioni standard sotto la media.
  • L’ultimo valore nel set di dati è 3,79 deviazioni standard sopra la media.

Il vantaggio di eseguire questo tipo di normalizzazione è che l’ovvio valore anomalo nel set di dati (134) è stato trasformato in modo tale da non essere più un enorme valore anomalo.

Se poi utilizziamo questo set di dati per adattare un qualche tipo di modello di apprendimento automatico , il valore anomalo non avrà più la stessa influenza che potrebbe avere sull’adattamento del modello.

Risorse addizionali

Le seguenti esercitazioni forniscono informazioni aggiuntive sulle diverse tecniche di normalizzazione:

Standardizzazione o normalizzazione: qual è la differenza?
Come normalizzare i dati tra 0 e 1
Come normalizzare i dati tra 0 e 100

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *