Interkwartielafstand en standaarddeviatie: wat is het verschil?
Het interkwartielbereik en de standaardafwijking zijn twee manieren om de verdeling van waarden in een dataset te meten.
Deze tutorial biedt een korte uitleg van elke statistiek, samen met de overeenkomsten en verschillen tussen de twee.
Interkwartielbereik
Het interkwartielbereik (IQR) van een dataset is het verschil tussen het eerste kwartiel (het 25e percentiel) en het derde kwartiel (het 75e percentiel). Het meet de verdeling van de gemiddelde 50% van de waarden.
IQR = Q3 – Q1
Stel dat we bijvoorbeeld de volgende gegevensset hebben:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Volgens de interkwartielbereikcalculator wordt het interkwartielbereik (IQR) voor deze dataset als volgt berekend:
- T1: 12
- T3: 26,5
- IQR = Q3 – Q1 = 14,5
Dit vertelt ons dat de middelste 50% van de waarden in de dataset een afwijking van 14,5 hebben.
Standaardafwijking
De standaardafwijking van een dataset is een manier om de typische afwijking van individuele waarden van de gemiddelde waarde te meten. Het wordt als volgt berekend:
s = √(Σ(x ik – X ) 2 / (n-1))
Stel dat we bijvoorbeeld de volgende gegevensset hebben:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
We kunnen een rekenmachine gebruiken om te bepalen dat de standaardafwijking van deze gegevensset 9,25 is. Dit geeft ons een idee van hoe ver de typische waarde afwijkt van het gemiddelde.
Overeenkomsten en verschillen
Het interkwartielbereik en de standaardafwijking hebben de volgende gelijkenis:
- Beide statistieken meten de verdeling van waarden in een dataset.
Het interkwartielbereik en de standaarddeviatie hebben echter het volgende belangrijke verschil:
- De interkwartielafstand (IQR) wordt niet beïnvloed door extreme uitschieters. Een extreem kleine of extreem grote waarde in een dataset heeft bijvoorbeeld geen invloed op de IQR-berekening, omdat de IQR alleen de 25e percentiel- en 75e percentielwaarden van de dataset gebruikt.
- De standaarddeviatie wordt beïnvloed door extreme uitschieters. Een extreem grote waarde in een dataset zal bijvoorbeeld resulteren in een veel grotere standaardafwijking, aangezien de standaardafwijking elke waarde in een dataset in zijn formule gebruikt.
Wanneer moet u ze allemaal gebruiken?
Je moet het interkwartielbereik gebruiken om de verdeling van waarden in een dataset te meten als er extreme uitschieters zijn.
Omgekeerd moet u de standaarddeviatie gebruiken om de verdeling van waarden te meten als er geen extreme uitschieters zijn.
Om te illustreren waarom, bekijk de volgende dataset:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Eerder in het artikel hebben we de volgende statistieken voor deze dataset berekend:
- IQR: 14,5
- Standaardafwijking: 9,25
Bedenk echter of de dataset een extreme uitbijter had:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
We kunnen een rekenmachine gebruiken om de volgende statistieken voor deze dataset te vinden:
- IQR: 15
- Standaardafwijking: 85,02
Merk op dat de interkwartielafstand nauwelijks verandert als er een uitbijter aanwezig is, terwijl de standaarddeviatie toeneemt van 9,25 naar 85,02.
Aanvullende bronnen
Maatregelen van centrale tendens: definitie en voorbeelden
Verspreidingsmaatregelen: definitie en voorbeelden
Hoe u uitschieters kunt vinden met behulp van het interkwartielbereik