Hoe de interkwartielafstand te interpreteren: met voorbeelden
Het interkwartielbereik van een dataset, vaak afgekort als IQR, is het verschil tussen het eerste kwartiel (het 25e percentiel) en het derde kwartiel (het 75e percentiel) van de dataset.
Simpel gezegd meet het de afwijking tussen de middelste 50% van de waarden.
IQR = Q3 – Q1
Stel dat we bijvoorbeeld de volgende gegevensset hebben die de hoogte van 17 verschillende planten (in inches) in een laboratorium toont:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Volgens de interkwartielbereikcalculator wordt het interkwartielbereik (IQR) voor deze dataset als volgt berekend:
- T1: 12
- T3: 26,5
- IQR = Q3 – Q1 = 14,5
Dit vertelt ons dat de middelste 50% van de waarden in de dataset een spreiding van 14,5 inch hebben.
Waarom het interkwartielbereik nuttig is
Het interkwartielbereik is een manier om de verdeling van waarden in een dataset te meten, maar er zijn andere distributiemaatstaven, zoals:
- Bereik: Meet het verschil tussen de minimum- en maximumwaarde in een dataset.
- Standaardafwijking: Meet de typische afwijking van individuele waarden van de gemiddelde waarde in een dataset.
Het voordeel van het gebruik van het interkwartielbereik (IQR) om de verdeling van waarden in een dataset te meten, is dat deze niet wordt beïnvloed door extreme uitschieters.
Een extreem kleine of extreem grote waarde in een dataset heeft bijvoorbeeld geen invloed op de IQR-berekening, omdat de IQR alleen de 25e percentiel- en 75e percentielwaarden van de dataset gebruikt.
Om dit te illustreren, bekijken we de volgende dataset:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Deze dataset heeft de volgende voortplantingsmetingen
- IQR: 14,5
- Standaardafwijking: 9,25
- Bereik: 31
Bedenk echter of de dataset een extreme uitbijter had:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
We zouden een rekenmachine kunnen gebruiken om de volgende spreidingsmetingen voor deze dataset te vinden:
- IQR: 15
- Standaardafwijking: 85,02
- Bereik: 377
Merk op dat de interkwartielafstand nauwelijks verandert als er een uitbijter aanwezig is, terwijl de standaarddeviatie en de afstand beide dramatisch veranderen.
Vergelijking van interkwartielbereiken tussen datasets
Het interkwartielbereik kan ook worden gebruikt om de verdeling van waarden tussen verschillende datasets te vergelijken.
Stel dat we bijvoorbeeld drie gegevenssets hebben met de volgende IQR-waarden:
- IQR van dataset 1: 13,5
- IQR van dataset 2: 24,4
- Gegevensset 3 IQR: 8.7
Dit vertelt ons dat de kloof tussen de middelste 50% van de waarden het grootst is voor Dataset 2 en het kleinst voor Dataset 3.
Aanvullende bronnen
Hoe het interkwartielbereik in Excel te berekenen
Hoe het interkwartielbereik in Python te berekenen
Hoe u uitschieters kunt vinden met behulp van het interkwartielbereik
Interkwartielafstandscalculator