5 voorbeelden van uitschieters in het echte leven


Een uitbijter is een datapunt dat abnormaal ver verwijderd is van andere waarden in een dataset.

We definiëren een datapunt vaak als een uitschieter als het 1,5 keer het interkwartielbereik boven het derde kwartiel of 1,5 keer het interkwartielbereik onder het eerste kwartiel van een dataset ligt.

Opmerking : het interkwartielbereik is het verschil tussen het derde kwartiel (75e percentiel) en het eerste kwartiel (25e percentiel) van een dataset.

De volgende scenario’s tonen voorbeelden van uitschieters in praktijksituaties.

Voorbeeld 1: Inkomensuitschieters

Een concreet scenario waarin vaak uitschieters voorkomen is dat van de inkomensverdeling.

Het 25e percentiel (Q1) van het jaarinkomen in een bepaald land kan bijvoorbeeld $15.000 per jaar bedragen en het 75e percentiel (Q3) $120.000 per jaar.

De interkwartielafstand (IQR) wordt als volgt berekend: €120.000 – €15.000 = €105.000.

Dit betekent dat iedereen wiens inkomen buiten de volgende grenzen valt, als een uitbijter wordt beschouwd:

  • Ondergrens : Q1 – 1,5*IQR = $15.000 – 1,5*$105.000 = -$142.500
  • Bovengrens : Q3 + 1,5*IQR = $120.000 + 1,5*$105.000 = $277.500

Iemand als Elon Musk, wiens nettowaarde in de biljoenen dollars ligt, zou als een uitschieter worden beschouwd in termen van jaarinkomen.

Let op : De waarde van uitschieters boven de ondergrens is niet altijd zinvol, het is bijvoorbeeld niet mogelijk om een negatief jaarinkomen te verdienen.

Voorbeeld 2: Apneu-uitschieters

Een ander realistisch scenario waarin uitschieters vaak voorkomen, is apneu.

Het 25e percentiel (Q1) voor hoe lang individuen hun adem kunnen inhouden is bijvoorbeeld ongeveer 15 seconden, terwijl het 75e percentiel (Q3) ongeveer 75 seconden is.

De interkwartielafstand (IQR) wordt als volgt berekend: 75 – 15 = 60.

Dit betekent dat iedereen die zijn adem kan inhouden buiten de volgende limieten, als een uitbijter wordt beschouwd:

  • Ondergrens : Q1 – 1,5*IQR = 15 – 1,5*60 = -75 seconden
  • Bovengrens : Q3 + 1,5*IQR = 75 + 1,5*60 = 165 seconden

Alle vrijduikers die hun adem 10 minuten of langer kunnen inhouden, worden als uitschieters beschouwd omdat ze hun adem veel langer dan 165 seconden kunnen inhouden.

Voorbeeld 3: Uitschieters in diergrootte

Een ander realistisch scenario waarin uitschieters vaak voorkomen, is de grootte van het dier.

Het 25e percentiel (Q1) van de paardenlengte is bijvoorbeeld ongeveer 1,5 meter en het 75e percentiel (Q3) is ongeveer 1,5 meter.

Het interkwartielbereik (IQR) wordt als volgt berekend: 5,5 – 5 = 0,5 voet.

Dit betekent dat elk paard waarvan de grootte buiten de volgende limieten valt, als een uitbijter wordt beschouwd:

  • Ondergrens : Q1 – 1,5*IQR = 5 – 1,5*0,5 = 4,25 voet
  • Bovengrens : Q3 + 1,5*IQR = 5 + 1,5*0,5 = 1,75 meter

Volgens Guinness World Records staat het record voor het hoogste paard aller tijden op iets meer dan 2 meter. Aangezien dit boven de bovengrens van 1,75 meter ligt, zou dit paard duidelijk als een uitschieter worden beschouwd.

Voorbeeld 4: Uitschieters in de verkoop van bioscoopkaartjes

Een ander realistisch scenario waarin uitschieters vaak voorkomen, is de verkoop van bioscoopkaartjes.

Het 25e percentiel (Q1) van de bruto verkoop van bioscoopkaartjes bedraagt bijvoorbeeld ongeveer $2 miljoen en het 75e percentiel (Q3) ongeveer $15 miljoen.

De interkwartielafstand (IQR) wordt als volgt berekend: $15 miljoen – $2 miljoen = $13 miljoen.

Dit betekent dat elke film waarvan de bruto-omzet buiten de volgende limieten valt, als een uitbijter wordt beschouwd:

  • Ondergrens : T1 – 1,5*IQR = $2 miljoen – 1,5*$13 miljoen = -$17,5 miljoen
  • Bovengrens : T3 + 1,5*IQR = $15 miljoen + 1,5*$13 miljoen = $34,5 miljoen

De meeste Star Wars-films hebben ruim $34,5 miljoen opgebracht, waardoor ze uitschieters zijn in termen van kaartverkoop.

Voorbeeld 5: Uitschieters in gescoorde punten per wedstrijd

Een ander gebied in de echte wereld waarin uitschieters vaak voorkomen, is de professionele sport.

Het 25e percentiel (Q1) van de door NBA-spelers gescoorde punten is bijvoorbeeld ongeveer 5 punten per wedstrijd en het 75e percentiel (Q3) is ongeveer 15 punten per wedstrijd.

De interkwartielafstand (IQR) wordt als volgt berekend: 15 – 5 = 10 punten.

Dit betekent dat elke speler wiens gemiddelde buiten de volgende limieten valt, als een uitbijter wordt beschouwd:

  • Ondergrens : Q1 – 1,5*IQR = 5 – 1,5*10 = -10 punten
  • Bovengrens : Q3 + 1,5*IQR = 15 + 1,5*10 = 30 punten

In veel NBA-seizoenen scoort de hoogst scorende speler doorgaans iets meer dan 30 punten per wedstrijd, waardoor hij een uitschieter is.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u uitschieters in datasets kunt vinden met behulp van verschillende statistische software:

Hoe u uitschieters kunt vinden in Excel
Hoe uitschieters in R te vinden
Hoe vind je uitschieters in Python?
Hoe vind je uitschieters in SPSS?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert