Come normalizzare i dati tra 0 e 1
Per normalizzare i valori in un set di dati compresi tra 0 e 1, è possibile utilizzare la seguente formula:
z i = (x i – min(x)) / (max(x) – min(x))
Oro:
- z i : l’ iesimo valore normalizzato nel set di dati
- x i : l’i -esimo valore del set di dati
- min(x) : il valore minimo nel set di dati
- max(x): il valore massimo nel set di dati
Ad esempio, supponiamo di avere il seguente set di dati:
Il valore minimo nel set di dati è 13 e il valore massimo è 71.
Per normalizzare il primo valore di 13 , applicheremmo la formula condivisa in precedenza:
- z i = (x i – min(x)) / (max(x) – min(x)) = (13 – 13) / (71 – 13) = 0
Per normalizzare il secondo valore di 16 , utilizzeremmo la stessa formula:
- z i = (x i – min(x)) / (max(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517
Per normalizzare il terzo valore di 19 , utilizzeremmo la stessa formula:
- z i = (x i – min(x)) / (max(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034
Possiamo usare esattamente la stessa formula per normalizzare ogni valore nel set di dati originale tra 0 e 1:
Utilizzando questo metodo di normalizzazione, le seguenti affermazioni saranno sempre vere:
- Il valore normalizzato per il valore minimo nel set di dati sarà sempre 0.
- Il valore normalizzato per il valore massimo nel set di dati sarà sempre 1.
- I valori normalizzati per tutti gli altri valori nel set di dati saranno compresi tra 0 e 1.
Quando normalizzare i dati
Spesso standardizziamo le variabili quando stiamo eseguendo un tipo di analisi in cui abbiamo più variabili misurate su scale diverse e vogliamo che ciascuna variabile abbia lo stesso intervallo.
Ciò impedisce che una variabile abbia un’influenza eccessiva, soprattutto se viene misurata in unità diverse (ad esempio se una variabile è misurata in pollici e un’altra in iarde).
Vale anche la pena notare che in questo tutorial abbiamo utilizzato un metodo noto come normalizzazione min-max per normalizzare i valori dei dati.
I due metodi di normalizzazione più comuni sono:
1. Normalizzazione Min-Max
- Scopo: converte ciascun valore di dati in un valore compreso tra 0 e 100.
- Formula: Nuovo valore = (valore – min) / (max – min) * 100
2. Normalizzazione media
- Scopo: scala i valori in modo tale che la media di tutti i valori sia 0 e std. dev. è 1.
- Formula: Nuovo valore = (valore – media) / (deviazione standard)
Risorse addizionali
I seguenti tutorial spiegano come normalizzare i dati utilizzando diversi software statistici:
Come normalizzare i dati in Excel
Come normalizzare i dati in R
Come normalizzare le colonne in Python