Waarom is bereik belangrijk in statistieken?
In statistieken vertegenwoordigt bereik het verschil tussen de kleinste en grootste waarde in een reeks gegevens.
Stel dat we bijvoorbeeld de volgende gegevensset hebben:
Gegevensset: 3, 4, 11, 15, 19, 19, 19, 22, 22, 23, 23, 26
Om het bereik te berekenen, kunnen we de volgende formule gebruiken:
- Bereik = Maximale waarde – Minimale waarde
- Bereik = 26 – 3
- Bereik = 23
Het bereik is 23 . Dit vertegenwoordigt het verschil tussen de kleinste en grootste waarden in de dataset.
In statistieken is bereik belangrijk om de volgende redenen:
Reden 1 : Dit vertelt ons de distributie van de volledige dataset.
Reden 2 : Het vertelt ons welke extreme waarden mogelijk zijn in een bepaalde dataset.
De volgende voorbeelden illustreren elk van deze redenen in de praktijk.
Reden 1: Bereik vertelt ons de distributie van een volledige dataset
Het bereik vertelt ons de distributie van een volledige dataset.
Stel dat we bijvoorbeeld de volgende dataset hebben die de examenscores van 20 verschillende studenten in een klas toont:
Het bereik van de examenresultaten wordt als volgt berekend:
- Bereik = Maximale waarde – Minimale waarde
- Bereik = 98 – 68
- Bereik = 30
Het bereik blijkt 30 te zijn. Dit vertegenwoordigt het verschil tussen het hoogste cijfer op het examen en het laagste cijfer in de klas.
Door deze meting nauwkeurig te kennen, kan de klasleraar snel de verdeling van waarden in examenresultaten onder alle leerlingen begrijpen.
Reden 2: Bereik vertelt ons welke extreme waarden mogelijk zijn in een bepaalde dataset
Het bereik vertelt ons welke extreme waarden mogelijk zijn in een bepaalde dataset.
Stel bijvoorbeeld dat een makelaar toegang heeft tot een database met de verkoopprijzen van 100.000 woningen in een bepaalde stad in de Verenigde Staten:
Laten we zeggen dat we statistische software (zoals Excel , R , Python , etc.) gebruiken om het bereik van deze dataset te berekenen en het volgende te vinden:
- Bereik = maximale waarde – minimale waarde
- Bereik = 854.000 – 194.000
- Bereik = 660.000
Als de makelaar een klant heeft met een aankoopbudget van minder dan € 194.000,- of meer dan € 854.000,-, kan de makelaar meteen weten dat geen enkel huis in die bepaalde stad aan de criteria voor aankoop zal voldoen.
De achterkant van het gebruik van het strand
Het bereik heeft een nadeel: het wordt beïnvloed door uitschieters .
Om dit te illustreren, bekijken we de volgende dataset:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Het bereik van deze dataset is 32 – 1 = 31 .
Bedenk echter of de dataset een extreme uitbijter had:
Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Het bereik van deze dataset zou nu 378 – 1 = 377 zijn.
Merk op hoe het bereik drastisch verandert als gevolg van een uitbijter.
Voordat u het bereik van een dataset berekent, is het een goed idee om eerst te controleren of er uitschieters zijn die het bereik misleidend kunnen maken.
Aanvullende bronnen
In de volgende tutorials wordt het belang van andere maatregelen in de statistiek uitgelegd:
Waarom is het gemiddelde belangrijk in statistieken?
Waarom is de mediaan belangrijk in statistieken?
Waarom is modus belangrijk in statistieken?
Waarom is standaarddeviatie belangrijk in statistieken?