Z-score
In dit artikel wordt uitgelegd wat de Z-score is in de statistieken. U leert ook hoe u de Z-score van een aandeel kunt berekenen, voorbeelden van hoe deze wordt berekend en wat de kenmerken van Z-scores zijn.
Wat is de Z-score?
De Z-score , of Z-score , is een statistische score die aangeeft hoeveel standaarddeviaties een waarde heeft van het gemiddelde. Om een Z-score voor een waarde te berekenen, trekt u het gemiddelde van die waarde af en deelt u dit vervolgens door de standaarddeviatie van de gegevenssteekproef.
Als een waarde bijvoorbeeld twee standaarddeviaties minder is dan het rekenkundig gemiddelde van de gegevensset, is de Z-score voor die waarde -2.
Deze statistische term wordt ook wel standaardscore , Z-statistiek of Z-waarde genoemd.
De Z-score van een waarde is zeer nuttig bij het testen van hypothesen om de grenzen van de betrouwbaarheidsintervallen te berekenen en daarmee het gebied van verwerping van de nulhypothese.
Z-score formule
De Z-score is gelijk aan het verschil tussen de waarde en het gemiddelde van de dataset gedeeld door de standaarddeviatie. Om de Z-score te vinden, moet u daarom eerst het gemiddelde van de waarde aftrekken en vervolgens het resultaat delen door de standaarddeviatie.
Kort gezegd is de Z-score-formule :
Goud
is de Z-score,
is de waarde waaruit de Z-score wordt berekend,
is het rekenkundig gemiddelde en
is de standaardafwijking of typische afwijking.
De interpretatie van de Z-score-waarde is eenvoudig: de Z-score-waarde geeft het aantal standaardafwijkingen aan tussen een waarde en het gemiddelde. Hoe groter de absolute waarde van de Z-score, hoe verder de waarde zal afwijken van het gemiddelde.
Voorbeelden van Z-scores
Nadat we de definitie van de Z-score hebben gezien, zodat u de betekenis ervan beter kunt begrijpen, gaan we in deze sectie verder met het oplossen van een voorbeeld waarin verschillende Z-scores worden berekend.
- Bereken Z-scores voor alle volgende gegevens: 7, 2, 4, 9, 3
Eerst moeten we het rekenkundig gemiddelde van de voorbeeldgegevens vinden:
Ten tweede berekenen we de standaardafwijking van de gegevensreeksen:
En ten slotte passen we de Z-score-formule toe voor elke gegevens en berekenen we alle Z-scores:
De Z-score en de vuistregel
In het geval dat de verdeling van de steekproef een normale verdeling is , kunnen we dankzij de empirische regel snel weten welk percentage van de waarden overeenkomt met een waarde door de Z-score ervan te berekenen.
De vuistregel stelt dus dat bij elke normale verdeling het volgende waar is:
- 68% van de waarden ligt binnen één standaardafwijking van het gemiddelde.
- 95% van de waarden ligt binnen twee standaarddeviaties van het gemiddelde.
- 99,7% van de waarden ligt binnen drie standaarddeviaties van het gemiddelde.
Als dit een normale verdeling is, kunnen we uit de vuistregel het volgende afleiden:
- Als de Z-score kleiner is dan 1, bevindt de waarde zich in de bovenste 68% van de waarden.
- Als de Z-score groter is dan 1 maar kleiner dan 2, bevindt de waarde zich in de bovenste 95% van de waarden.
- Als de Z-score groter is dan 2 maar kleiner dan 3, behoort de waarde tot de 99,7% van de waarden.
Meer waarden van de vuistregel kunt u in de volgende tabel zien:
Z-score-eigenschappen
Z-scores hebben de volgende eigenschappen:
- Het rekenkundig gemiddelde van alle Z-scores is altijd 0.
- De standaarddeviatie van Z-scores is 1.
- Z-scores zijn dimensieloos, aangezien de eenheden van de teller opheffen met de eenheden van de noemer.
- Als een Z-score positief is, betekent dit dat de waarde groter is dan het steekproefgemiddelde. Aan de andere kant, als de Z-score negatief is, betekent dit dat de waarde lager is dan het steekproefgemiddelde.
- Z-scores zijn erg handig voor het vergelijken van verschillende distributies.