Hoe gegevens in excel te normaliseren
Het ‘normaliseren’ van een reeks gegevenswaarden betekent dat de waarden zodanig worden geschaald dat het gemiddelde van alle waarden 0 is en de standaarddeviatie 1.
In deze zelfstudie wordt uitgelegd hoe u gegevens in Excel kunt normaliseren.
Voorbeeld: Gegevens normaliseren in Excel
Stel dat we de volgende gegevensset in Excel hebben:
Voer de volgende stappen uit om deze set gegevenswaarden te normaliseren.
Stap 1: Zoek het gemiddelde.
Eerst zullen we de functie =AVERAGE(waardenbereik) gebruiken om het gemiddelde van de dataset te vinden.
Stap 2: Zoek de standaarddeviatie.
Vervolgens zullen we de functie =STDEV (waardenbereik) gebruiken om de standaardafwijking van de dataset te vinden.
Stap 3: Normaliseer de waarden.
Ten slotte zullen we de functie STANDARDIZE(x, Mean, standard_dev) gebruiken om elk van de waarden in de dataset te normaliseren.
OPMERKING:
De functie STANDARDIZE gebruikt de volgende formule om een bepaalde gegevenswaarde te normaliseren:
Genormaliseerde waarde = (x – x ) / s
Goud:
- x = gegevenswaarde
- x = gemiddelde van de dataset
- s = standaardafwijking van de dataset
De volgende afbeelding toont de formule die wordt gebruikt om de eerste waarde in de gegevensset te normaliseren:
Zodra we de eerste waarde in cel B2 hebben genormaliseerd, kunnen we de muisaanwijzer op de rechterbenedenhoek van cel B2 plaatsen totdat er een kleine + verschijnt. Dubbelklik op de + om de formule naar de overige cellen te kopiëren:
Nu is elke waarde in de dataset genormaliseerd.
Hoe genormaliseerde gegevens te interpreteren
De formule die we gebruikten om een gegeven gegevenswaarde, x, te normaliseren was:
Genormaliseerde waarde = (x – x ) / s
Goud:
- x = gegevenswaarde
- x = gemiddelde van de dataset
- s = standaardafwijking van de dataset
Als een bepaald datapunt een genormaliseerde waarde groter dan 0 heeft, geeft dit aan dat het datapunt boven het gemiddelde ligt. Omgekeerd geeft een genormaliseerde waarde kleiner dan 0 aan dat het gegevenspunt onder het gemiddelde ligt.
In het bijzonder vertelt de genormaliseerde waarde ons hoeveel standaarddeviaties het oorspronkelijke gegevenspunt verwijderd is van het gemiddelde. Beschouw bijvoorbeeld datapunt “12” in onze oorspronkelijke dataset:
De genormaliseerde waarde voor „12“ bleek -1,288 te zijn, als volgt berekend:
Genormaliseerde waarde = (x – x ) / s = (12 – 22,267) / 7,968 = -1,288
Dit vertelt ons dat de waarde “12” 1,288 standaarddeviaties lager is dan het gemiddelde van de oorspronkelijke dataset.
Elk van de genormaliseerde waarden in de dataset kan ons helpen begrijpen hoe dichtbij of ver een bepaalde gegevenswaarde van het gemiddelde verwijderd is. Een kleine genormaliseerde waarde geeft aan dat een waarde dicht bij het gemiddelde ligt, terwijl een grote genormaliseerde waarde aangeeft dat een waarde ver van het gemiddelde ligt.