Links- of rechtsscheve verdelingen
Scheefheid is een manier om de symmetrie van een verdeling te beschrijven.
Een verdeling is scheef als deze een ‘staart’ heeft aan de linkerkant van de verdeling:
Een verdeling is rechtsscheef als deze een ‘staart’ heeft aan de rechterkant van de verdeling:
En een verdeling heeft geen bias als deze aan beide kanten symmetrisch is:
Merk op dat linksscheve verdelingen soms „negatief scheve“ verdelingen worden genoemd en dat rechtsscheve verdelingen soms „positief scheve“ verdelingen worden genoemd.
Eigenschappen van scheve verdelingen
De volgende diagrammen laten zien waar het gemiddelde, de mediaan en de modus doorgaans in verschillende verdelingen liggen.
Linksscheve verdeling: gemiddelde <mediaan <modus
Bij een linksscheve verdeling is het gemiddelde kleiner dan de mediaan.
Rechtsscheve verdeling: Modus < Mediaan < Gemiddelde
Bij een rechtsscheve verdeling is het gemiddelde groter dan de mediaan.
Geen vertekening: gemiddelde = mediaan = modus
Bij een symmetrische verdeling zijn het gemiddelde, de mediaan en de modus allemaal gelijk.
Boxplots gebruiken om asymmetrie te visualiseren
Een boxplot is een type plot dat de vijfcijferige samenvatting van een dataset weergeeft, waaronder:
- De minimumwaarde
- Het eerste kwartiel (het 25e percentiel)
- De gemiddelde waarde
- Het derde kwartiel (het 75e percentiel)
- De maximale waarde
Om een boxplot te maken, tekenen we een box van het eerste tot en met het derde kwartiel. Vervolgens tekenen we een verticale lijn op de mediaan. Ten slotte tekenen we ‘snorharen’ van de kwartielen tot aan de minimale en maximale waarde.
Op basis van de locatie van de mediaanwaarde in de boxplot kunnen we bepalen of een verdeling linksscheef, rechtsscheef of symmetrisch is.
Wanneer de mediaan dichter bij de onderkant van de doos ligt en de snorhaar aan de onderkant van de doos korter is, is de verdeling rechtsscheef.
Wanneer de mediaan dichter bij de bovenkant van de doos ligt en de snorhaar aan de bovenkant van de doos korter is, blijft de verdeling scheef.
Wanneer de mediaan zich in het midden van de doos bevindt en de snorharen aan elke kant ongeveer gelijk zijn, is de verdeling symmetrisch.
Voorbeelden van scheve verdelingen
Hier zijn enkele concrete voorbeelden van scheve verdelingen.
Linksscheve verdeling: de verdeling van de leeftijd van sterfgevallen.
De leeftijdsverdeling van sterfgevallen is in de meeste populaties scheef naar links. De meeste mensen leven tussen de 70 en 80 jaar oud, en steeds minder mensen leven onder deze leeftijd.
Rechtsscheve verdeling: de verdeling van het gezinsinkomen.
De verdeling van het gezinsinkomen in de Verenigde Staten is scheef naar rechts: de meeste huishoudens verdienen tussen de $40.000 en $80.000 per jaar, maar er is een lange rechterstaart van huishoudens die veel meer verdienen.
No Skew: de verdeling van mannelijke maten.
Het is bekend dat de grootte van mannen ongeveer normaal is en geen asymmetrie vertoont. De gemiddelde lengte van een man in de Verenigde Staten is bijvoorbeeld ongeveer 69,1 inch. De hoogteverdeling is ruwweg symmetrisch, waarbij sommige korter en andere groter zijn.
Aanvullende bronnen
5 voorbeelden van positief scheve verdelingen
5 voorbeelden van negatief scheve verdelingen
Hoe scheefheid in Excel te berekenen
Hoe asymmetrie in boxplots te identificeren