Normalisatie van de z-score: definitie en voorbeelden


Z-score-normalisatie verwijst naar het proces waarbij elke waarde in een dataset wordt genormaliseerd, zodat het gemiddelde van alle waarden 0 is en de standaardafwijking 1.

We gebruiken de volgende formule om z-score-normalisatie uit te voeren op elke waarde in een dataset:

Nieuwe waarde = (x – μ) / σ

Goud:

  • x : Oorspronkelijke waarde
  • μ : Gemiddelde van gegevens
  • σ : Standaardafwijking van de gegevens

In het volgende voorbeeld ziet u hoe u in de praktijk z-score-normalisatie op een gegevensset kunt uitvoeren.

Voorbeeld: Z-Score-normalisatie uitvoeren

Stel dat we de volgende dataset hebben:

Met behulp van een rekenmachine kunnen we zien dat het gemiddelde van de dataset 21,2 is en de standaarddeviatie 29,8 .

Om z-score-normalisatie uit te voeren naar de eerste waarde in de dataset, kunnen we de volgende formule gebruiken:

  • Nieuwe waarde = (x – μ) / σ
  • Nieuwe waarde = (3 – 21,2) / 29,8
  • Nieuwe waarde = -0,61

We kunnen deze formule gebruiken om z-score-normalisatie uit te voeren op elke waarde in de dataset:

Het gemiddelde van de genormaliseerde waarden is 0 en de standaardafwijking van de genormaliseerde waarden is 1 .

Genormaliseerde waarden vertegenwoordigen het aantal standaardafwijkingen tussen de oorspronkelijke waarde en het gemiddelde.

Bijvoorbeeld:

  • De eerste waarde in de dataset ligt 0,61 standaardafwijkingen onder het gemiddelde.
  • De tweede waarde in de dataset ligt 0,54 standaardafwijkingen onder het gemiddelde.
  • De laatste waarde in de dataset is 3,79 standaardafwijkingen boven het gemiddelde.

Het voordeel van het uitvoeren van dit type normalisatie is dat de voor de hand liggende uitbijter in de dataset (134) zodanig is getransformeerd dat deze niet langer een enorme uitbijter is.

Als we deze dataset vervolgens gebruiken om in een bepaald type machine learning-model te passen, zal de uitbijter niet langer zoveel invloed hebben als hij zou kunnen hebben op de pasvorm van het model.

Aanvullende bronnen

De volgende tutorials bieden aanvullende informatie over verschillende normalisatietechnieken:

Standaardisatie of normalisatie: wat is het verschil?
Hoe gegevens tussen 0 en 1 te normaliseren
Hoe gegevens tussen 0 en 100 te normaliseren

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert