Come normalizzare i dati tra 0 e 1


Per normalizzare i valori in un set di dati compresi tra 0 e 1, è possibile utilizzare la seguente formula:

z i = (x i – min(x)) / (max(x) – min(x))

Oro:

  • z i : l’ iesimo valore normalizzato nel set di dati
  • x i : l’i -esimo valore del set di dati
  • min(x) : il valore minimo nel set di dati
  • max(x): il valore massimo nel set di dati

Ad esempio, supponiamo di avere il seguente set di dati:

Il valore minimo nel set di dati è 13 e il valore massimo è 71.

Per normalizzare il primo valore di 13 , applicheremmo la formula condivisa in precedenza:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (13 – 13) / (71 – 13) = 0

Per normalizzare il secondo valore di 16 , utilizzeremmo la stessa formula:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (16 – 13) / (71 – 13) = 0,0517

Per normalizzare il terzo valore di 19 , utilizzeremmo la stessa formula:

  • z i = (x i – min(x)) / (max(x) – min(x)) = (19 – 13) / (71 – 13) = 0,1034

Possiamo usare esattamente la stessa formula per normalizzare ogni valore nel set di dati originale tra 0 e 1:

Normalizza i dati tra 0 e 1

Utilizzando questo metodo di normalizzazione, le seguenti affermazioni saranno sempre vere:

  • Il valore normalizzato per il valore minimo nel set di dati sarà sempre 0.
  • Il valore normalizzato per il valore massimo nel set di dati sarà sempre 1.
  • I valori normalizzati per tutti gli altri valori nel set di dati saranno compresi tra 0 e 1.

Quando normalizzare i dati

Spesso standardizziamo le variabili quando stiamo eseguendo un tipo di analisi in cui abbiamo più variabili misurate su scale diverse e vogliamo che ciascuna variabile abbia lo stesso intervallo.

Ciò impedisce che una variabile abbia un’influenza eccessiva, soprattutto se viene misurata in unità diverse (ad esempio se una variabile è misurata in pollici e un’altra in iarde).

Vale anche la pena notare che in questo tutorial abbiamo utilizzato un metodo noto come normalizzazione min-max per normalizzare i valori dei dati.

I due metodi di normalizzazione più comuni sono:

1. Normalizzazione Min-Max

  • Scopo: converte ciascun valore di dati in un valore compreso tra 0 e 100.
  • Formula: Nuovo valore = (valore – min) / (max – min) * 100

2. Normalizzazione media

  • Scopo: scala i valori in modo tale che la media di tutti i valori sia 0 e std. dev. è 1.
  • Formula: Nuovo valore = (valore – media) / (deviazione standard)

Risorse addizionali

I seguenti tutorial spiegano come normalizzare i dati utilizzando diversi software statistici:

Come normalizzare i dati in Excel
Come normalizzare i dati in R
Come normalizzare le colonne in Python

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *