Gegevens normaliseren in google spreadsheets


Het normaliseren van een set datawaarden betekent het schalen van de waarden zodat het gemiddelde van alle waarden 0 is en de standaardafwijking 1.

In deze tutorial wordt uitgelegd hoe u gegevens in Google Spreadsheets kunt normaliseren.

Voorbeeld: gegevens normaliseren in Google Spreadsheets

Stel dat we de volgende gegevensset in Google Spreadsheets hebben:

Gebruik de volgende stappen om deze set gegevenswaarden te normaliseren.

Stap 1: Bereken het gemiddelde.

Eerst zullen we de functie =AVERAGE(waardenbereik) gebruiken om het gemiddelde van de dataset te vinden.

Stap 2: Zoek de standaarddeviatie.

Vervolgens zullen we de functie =STDEV (waardenbereik) gebruiken om de standaardafwijking van de dataset te vinden.

Stap 3: Normaliseer de waarden.

Ten slotte zullen we de functie STANDARDIZE(x, Mean, standard_dev) gebruiken om elk van de waarden in de dataset te normaliseren.

OPMERKING:

De functie STANDARDIZE gebruikt de volgende formule om een bepaalde gegevenswaarde te normaliseren:

Genormaliseerde waarde = (x – x ) / s

Goud:

  • x = gegevenswaarde
  • x = gemiddelde van de dataset
  • s = standaardafwijking van de dataset

De volgende afbeelding toont de formule die wordt gebruikt om de eerste waarde in de gegevensset te normaliseren:

Genormaliseerde gegevens in Google Spreadsheets

Zodra we de eerste waarde in cel B2 hebben genormaliseerd, kunnen we de muisaanwijzer op de rechterbenedenhoek van cel B2 plaatsen totdat er een kleine + verschijnt. Dubbelklik op de + om de formule naar de overige cellen te kopiëren:

Genormaliseerde dataset in Google Spreadsheets

Nu is elke waarde in de dataset genormaliseerd.

Hoe genormaliseerde gegevens te interpreteren

De formule die we gebruikten om een gegeven gegevenswaarde, x, te normaliseren was:

Genormaliseerde waarde = (x – x ) / s

Goud:

  • x = gegevenswaarde
  • x = gemiddelde van de dataset
  • s = standaardafwijking van de dataset

Als een bepaald datapunt een genormaliseerde waarde groter dan 0 heeft, betekent dit dat het datapunt boven het gemiddelde ligt. Omgekeerd geeft een genormaliseerde waarde kleiner dan 0 aan dat het gegevenspunt onder het gemiddelde ligt.

In het bijzonder vertelt de genormaliseerde waarde ons hoeveel standaarddeviaties het oorspronkelijke gegevenspunt verwijderd is van het gemiddelde. Beschouw bijvoorbeeld datapunt “12” in onze oorspronkelijke dataset:

Genormaliseerde dataset in Google Spreadsheets

De genormaliseerde waarde voor „12“ bleek -1,288 te zijn, als volgt berekend:

Genormaliseerde waarde = (x – x ) / s = (12 – 22,267) / 7,968 = -1,288

Dit vertelt ons dat de waarde “12” 1,288 standaarddeviaties lager is dan het gemiddelde van de oorspronkelijke dataset.

Elk van de genormaliseerde waarden in de dataset kan ons helpen begrijpen hoe dichtbij of ver een bepaalde gegevenswaarde van het gemiddelde verwijderd is. Een kleine genormaliseerde waarde geeft aan dat een waarde dicht bij het gemiddelde ligt, terwijl een grote genormaliseerde waarde aangeeft dat een waarde ver van het gemiddelde ligt.

Aanvullende bronnen

Hoe gegevens in Excel te normaliseren
Hoe gegevens in R te normaliseren

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert