Hoe gegevens tussen -1 en 1 te normaliseren
Om waarden in een dataset tussen -1 en 1 te normaliseren, kun je de volgende formule gebruiken:
z ik = 2 * ((x ik – x min ) / (x max – x min )) – 1
Goud:
- z i : de i-de genormaliseerde waarde in de dataset
- x i : de i- de waarde van de dataset
- x min : De minimumwaarde in de gegevensset
- x max : De maximale waarde in de gegevensset
Stel dat we bijvoorbeeld de volgende gegevensset hebben:
De minimumwaarde in de dataset is 13 en de maximumwaarde is 71.
Om de eerste waarde van 13 te normaliseren, zouden we de eerder gedeelde formule toepassen:
- z ik = 2 * ((x ik – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1
Om de tweede waarde van 16 te normaliseren, zouden we dezelfde formule gebruiken:
- z ik = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0,897
Om de derde waarde van 19 te normaliseren, zouden we dezelfde formule gebruiken:
- z ik = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0,793
We kunnen exact dezelfde formule gebruiken om elke waarde in de originele dataset tussen -1 en 1 te normaliseren:
Elke waarde in de genormaliseerde dataset ligt nu tussen -1 en 1.
Met behulp van deze normalisatiemethode zullen de volgende uitspraken altijd waar zijn:
- De genormaliseerde waarde voor de minimumwaarde in de dataset is altijd -1.
- De genormaliseerde waarde voor de maximale waarde in de dataset is altijd 1.
- Genormaliseerde waarden voor alle andere waarden in de dataset liggen tussen -1 en 1.
Wanneer gegevens normaliseren?
Vaak standaardiseren we variabelen wanneer we een soort analyse uitvoeren waarbij we meerdere variabelen op verschillende schalen laten meten en we willen dat elk van de variabelen hetzelfde bereik heeft.
Dit voorkomt dat één variabele teveel invloed heeft, vooral als deze in verschillende eenheden wordt gemeten (dat wil zeggen als de ene variabele in inches en de andere in yards wordt gemeten).
Merk ook op dat de normalisatiemethode die we hier hebben gebruikt slechts één mogelijke optie is.
In sommige gevallen is het zinvol om variabelen tussen 0 en 1, of zelfs tussen 0 en 100, te normaliseren.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere typen normalisatie kunt uitvoeren:
Hoe gegevens tussen 0 en 1 te normaliseren
Hoe gegevens tussen 0 en 100 te normaliseren