Interval versus interkwartielafstand: wat is het verschil?
In de statistieken zijn interval en interkwartielbereik twee manieren om de verdeling van waarden in een dataset te meten.
Bereik meet het verschil tussen de minimumwaarde en de maximumwaarde in een dataset.
Het interkwartielbereik meet het verschil tussen het eerste kwartiel (25e percentiel) en het derde kwartiel (75e percentiel) in een dataset. Dit vertegenwoordigt de verdeling van de middelste 50% van de waarden.
Voorbeeld: hoe u het interval en het interkwartielbereik berekent
Stel dat we de volgende dataset hebben:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
We kunnen de volgende stappen gebruiken om het bereik te berekenen:
- Bereik = Maximale waarde – Minimale waarde
- Bereik = 32 – 1
- Bereik = 31
We kunnen de interkwartielbereikcalculator gebruiken om ons te helpen het interkwartielbereik te berekenen:
- Interkwartielschaal = 3e kwartiel – 1e kwartiel
- Interkwartielschaal = 26,5 – 12
- Interkwartielbereik = 14,5
Het bereik vertelt ons de verdeling van de dataset, terwijl het interkwartielbereik ons de verdeling van de middelste helft van de dataset vertelt.
Bereik en interkwartielbereik: overeenkomsten en verschillen
Het interval en het interkwartielbereik hebben de volgende gelijkenis:
- Beide statistieken meten de verdeling van waarden in een dataset.
Het interval en het interkwartielbereik hebben echter het volgende verschil:
- Het bereik vertelt ons het verschil tussen de grootste en de kleinste waarde in de dataset.
- Het interkwartielbereik vertelt ons de verdeling van de middelste 50% van de waarden in de dataset.
Interval versus interkwartielbereik: wanneer moet u elk gebruiken?
We moeten bereik gebruiken als we het verschil tussen de grootste en kleinste waarden in een dataset willen begrijpen.
Stel bijvoorbeeld dat een professor een examen aflegt aan 100 studenten. Ze kan de schaal gebruiken om het verschil te begrijpen tussen de hoogste en laagste score die alle leerlingen in de klas behalen.
Omgekeerd moeten we het interkwartielbereik gebruiken als we de kloof tussen het 75e percentiel en het 25e percentiel van een dataset willen begrijpen.
Als een professor bijvoorbeeld een examen aan 100 studenten afneemt, kan hij of zij het interkwartielbereik gebruiken om snel inzicht te krijgen in het verschil in examenscore tussen een student die op het 75e percentiel heeft gescoord en een student die op het 25e percentiel heeft gescoord.
Opgemerkt moet worden dat we niet hoeven te kiezen tussen het gebruik van het interval of het interkwartielbereik om de verdeling van waarden in een dataset te beschrijven.
We kunnen beide statistieken gebruiken omdat ze ons totaal verschillende informatie verschaffen.
De achterkant van het gebruik van het strand
Het bereik heeft een nadeel: het wordt beïnvloed door uitschieters .
Om dit te illustreren, bekijken we de volgende dataset:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Het bereik van deze dataset is 32 – 1 = 31 .
Bedenk echter of de dataset een extreme uitbijter had:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Het bereik van deze dataset zou nu 378 – 1 = 377 zijn.
Merk op hoe het bereik drastisch verandert als gevolg van een uitbijter.
Voordat u het bereik van een dataset berekent, is het een goed idee om eerst te controleren of er uitschieters zijn die het bereik misleidend kunnen maken.
Aanvullende bronnen
De volgende tutorials bieden aanvullende informatie over het interkwartielbereik:
Hoe het interkwartielbereik te interpreteren
Hoe u uitschieters kunt vinden met behulp van het interkwartielbereik
Hoe het interkwartielbereik in Excel te berekenen