Come normalizzare i dati tra 0 e 100
Per normalizzare i valori in un set di dati compresi tra 0 e 100, è possibile utilizzare la seguente formula:
z i = (x i – min(x)) / (max(x) – min(x)) * 100
Oro:
- z i : l’ iesimo valore normalizzato nel set di dati
- x i : l’i -esimo valore del set di dati
- min(x) : il valore minimo nel set di dati
- max(x): il valore massimo nel set di dati
Ad esempio, supponiamo di avere il seguente set di dati:
Il valore minimo nel set di dati è 12 e il valore massimo è 68.
Per normalizzare il primo valore di 12 , applicheremmo la formula condivisa in precedenza:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
Per normalizzare il secondo valore di 19 , utilizzeremmo la stessa formula:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5
Per normalizzare il terzo valore di 21 , utilizzeremmo la stessa formula:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07
Possiamo usare esattamente la stessa formula per normalizzare ogni valore nel set di dati originale tra 0 e 100:
Come normalizzare i dati tra qualsiasi intervallo
Possiamo effettivamente utilizzare questa formula per normalizzare un set di dati tra 0 e qualsiasi numero:
z i = (x i – min(x)) / (max(x) – min(x)) * Q
dove Q è il numero massimo desiderato per i valori dei dati normalizzati.
Nell’esempio precedente, abbiamo scelto Q pari a 100, ma potremmo facilmente normalizzare un intervallo di valori di dati compreso tra 0 e 1000 scegliendo Q pari a 1000:
Per normalizzare il primo valore di 12 , applicheremmo la formula:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0
Per normalizzare il secondo valore di 19 , utilizzeremmo la stessa formula:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125
Per normalizzare il terzo valore di 21 , utilizzeremmo la stessa formula:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1.000 = (21 – 12) / (68 – 12) * 100 = 160,7
Possiamo usare esattamente la stessa formula per normalizzare ogni valore nel set di dati originale tra 0 e 1000:
Quando normalizzare i dati
A volte standardizziamo le variabili quando stiamo eseguendo un certo tipo di analisi in cui abbiamo più variabili misurate su scale diverse e vogliamo che ciascuna variabile abbia lo stesso intervallo.
Ciò impedisce che una variabile abbia un’influenza eccessiva, soprattutto se viene misurata in unità diverse (ad esempio se una variabile è misurata in pollici e un’altra in iarde).
Vale anche la pena notare che in questo tutorial abbiamo utilizzato un metodo noto come normalizzazione min-max per normalizzare i valori dei dati.
I due metodi di normalizzazione più comuni sono:
1. Normalizzazione Min-Max
- Scopo: converte ciascun valore di dati in un valore compreso tra 0 e 100.
- Formula: Nuovo valore = (valore – min) / (max – min) * 100
2. Normalizzazione media
- Scopo: scala i valori in modo tale che la media di tutti i valori sia 0 e std. dev. è 1.
- Formula: Nuovo valore = (valore – media) / (deviazione standard)
Risorse addizionali
Come normalizzare i dati tra 0 e 1
Come normalizzare i dati in Excel
Come normalizzare i dati in R
Come normalizzare le colonne in Python