Rechts-scheef histogram: voorbeelden en interpretatie
Een histogram is een soort diagram waarmee we de verdeling van waarden in een reeks gegevens kunnen visualiseren.
Er wordt gezegd dat een histogram rechtsscheef is als het een ‘staart’ heeft aan de rechterkant van de verdeling:
Opmerking : Soms wordt een naar rechts scheef histogram ook wel een positief scheve histogram genoemd.
Een naar rechts scheef histogram heeft de volgende twee eigenschappen:
1. De bovenkant van de verdeling bevindt zich aan de linkerkant.
2. Het gemiddelde is groter dan de mediaan.
Wat zorgt ervoor dat een histogram behoorlijk scheef is?
Een histogram is over het algemeen scheef naar rechts als er een limiet is voor de minimaal mogelijke waarde, maar geen limiet voor de maximaal mogelijke waarde.
Het meest voor de hand liggende voorbeeld uit de praktijk van een naar rechts scheef histogram is de inkomensverdeling in een land.
Het minimuminkomen dat iemand kan verdienen is nul dollar, terwijl er geen maximuminkomen bestaat dat iemand kan verdienen.
Over het algemeen kunnen de meeste mensen ongeveer $40.000 per jaar verdienen, maar er zijn een paar uitzonderingen die enkele miljoenen dollars per jaar verdienen.
Wanneer we een histogram maken om de inkomensverdeling te visualiseren, zal dit uiteraard scheef zijn:
Waarom is het gemiddelde groter dan de mediaan in een naar rechts scheef histogram?
In een naar rechts scheef histogram is het gemiddelde groter dan de mediaan, omdat hoge waarden aan de rechter „staart“ van de verdeling de waarde van het gemiddelde aanzienlijk zullen opdrijven.
Stel, als eenvoudig voorbeeld, dat we de volgende dataset hebben met daarin het inkomen van 10 personen:
Gegevensset 1: $30.000, $35.000, $35.000, $40.000, $50.000, $55.000, $55.000, $70.000, $90.000, $110.000
Hier zijn de gemiddelde en mediaanwaarden voor deze dataset:
- Gemiddeld : $57k
- Mediaan : $ 52,5k
Stel nu dat we een andere dataset hebben die exact hetzelfde inkomen bevat, behalve dat de laatste waarde nu $ 2,5 miljoen is:
Gegevensset 2: $30.000, $35.000, $35.000, $40.000, $50.000, $55.000, $55.000, $70.000, $90.000, $2,5 miljoen
Hier zijn de gemiddelde en mediaanwaarden voor deze dataset:
- Gemiddeld : $296k
- Mediaan : $ 52,5k
Deze laatste uitschieter leidt tot een forse stijging van het gemiddelde inkomen.
En als we deze verdeling uitzetten, zou het een naar rechts scheef histogram zijn met een waarde van $2,5 miljoen aan de rechter „staart“ van het histogram.
Het verschil tussen rechts- en linksscheve histogrammen
Het tegenovergestelde van een naar rechts scheef histogram is een naar links scheve histogram .
Dit is een type histogram met een „staart“ aan de linkerkant van de verdeling:
Dit type histogram heeft de volgende eigenschappen:
1. De piek van de verdeling bevindt zich aan de rechterkant.
2. Het gemiddelde is lager dan de mediaan.
Merk op dat dit precies de tegenovergestelde eigenschappen zijn van een naar rechts scheef histogram.
Leer meer over linksscheve histogrammen in deze zelfstudie .
Aanvullende bronnen
De volgende zelfstudies bieden aanvullende informatie over histogrammen:
Hoe u het gemiddelde en de mediaan van elk histogram kunt schatten
Hoe de standaardafwijking van elk histogram te schatten
Hoe de vorm van histogrammen te beschrijven