Hoe u uitschieters kunt vinden met behulp van het interkwartielbereik
Een uitschieter is een waarneming die abnormaal ver verwijderd is van andere waarden in een dataset. Uitschieters kunnen problematisch zijn omdat ze de resultaten van een analyse kunnen beïnvloeden.
Een gebruikelijke manier om uitbijters in een dataset te detecteren is door gebruik te maken van het interkwartielbereik .
Het interkwartielbereik, vaak afgekort als IQR, is het verschil tussen het 25e percentiel (Q1) en het 75e percentiel (Q3) in een dataset. Het meet de verdeling van de gemiddelde 50% van de waarden.
Een populaire methode is om een waarneming als uitschieter te bestempelen als deze een waarde heeft die 1,5 keer hoger is dan de IQR of 1,5 keer lager dan de IQR.
Deze zelfstudie biedt een stapsgewijs voorbeeld van hoe u met deze methode uitschieters in een gegevensset kunt vinden.
Stap 1: Creëer de gegevens
Stel dat we de volgende dataset hebben:
Stap 2: Identificeer het eerste en derde kwartiel
Het eerste kwartiel blijkt 5 te zijn en het derde kwartiel blijkt 20,75 te zijn.
Het interkwartielbereik blijkt dus 20,75 -5 = 15,75 te zijn.
Stap 3: Zoek de onder- en bovengrens
De ondergrens wordt als volgt berekend:
Ondergrens = Q1 – 1,5*IQR = 5 – 1,5*15,75 = -18,625
En de bovengrens wordt als volgt berekend:
Bovengrens = Q3 + 1,5*IQR = 20,75 + 1,5*15,75 = 44,375
Stap 4: Identificeer uitschieters
De enige waarneming in de dataset met een waarde onder de ondergrens of boven de bovengrens is 46 . Dit is dus de enige uitbijter in deze dataset.
Opmerking: u kunt deze calculator voor uitschieters gebruiken om automatisch de boven- en ondergrenzen van uitschieters in een bepaalde gegevensset te vinden.
Hoe vind je uitschieters in de praktijk?
In de volgende tutorials wordt uitgelegd hoe u uitschieters kunt vinden met behulp van het interkwartielbereik in verschillende statistische software:
Uitschieters vinden in Excel
Hoe uitschieters in R te vinden
Hoe vind je uitschieters in Python?
Hoe vind je uitschieters in SPSS?