Asymmetrische verdeling
In dit artikel wordt uitgelegd wat scheve verdelingen zijn. U vindt voorbeelden van scheve verdelingen en ook hoe u de scheefheid van een verdeling kunt berekenen.
Wat is een scheve verdeling?
In de statistieken is een scheve verdeling een verdeling die een ander aantal waarden links van het gemiddelde heeft dan het aantal waarden rechts van het gemiddelde. Met andere woorden: een asymmetrische verdeling is een verdeling die een asymmetrie heeft in de grafische weergave.
Er zijn twee soorten asymmetrische verdelingen :
- Positief scheve verdeling : De verdeling heeft rechts van het gemiddelde meer verschillende waarden dan links.
- Negatief scheve verdeling : De verdeling heeft meer verschillende waarden links van het gemiddelde dan rechts ervan.
De exponentiële verdeling is bijvoorbeeld een asymmetrische verdeling.
Voorbeelden van scheve verdelingen
Nu we de definitie van scheve verdeling kennen, gaan we een aantal voorbeelden bekijken om het concept volledig te begrijpen.
In het volgende voorbeeld ziet u een positief scheve verdeling omdat de rechterstaart groter is dan de linkerstaart. Met andere woorden: de verdeling heeft meer waarden rechts van het gemiddelde dan links.
Aan de andere kant vindt u hieronder een voorbeeld van een negatief scheve verdeling. Deze verdeling heeft een negatieve scheefheid omdat deze meer waarden links van het gemiddelde heeft dan rechts.
Houd er bovendien rekening mee dat er ook symmetrische verdelingen bestaan. Klik op de volgende link om voorbeelden van symmetrische verdelingen te bekijken:
Hoe weet je of een verdeling scheef is?
Traditioneel wordt uitgelegd dat de scheefheid van een verdeling kan worden bepaald op basis van de relatie tussen het gemiddelde en de mediaan. Deze eigenschap is echter niet altijd waar. Daarom moet een scheefheidscoëfficiënt worden berekend om te weten hoe de curve van een verdeling eruit ziet.
Om te bepalen of een verdeling symmetrisch is of niet, is het dus noodzakelijk om de Pearson-asymmetriecoëfficiënt te berekenen, waarvan de formule is:
Goud
is de Pearson-coëfficiënt,
het rekenkundig gemiddelde,
mode (statistieken) en
de standaardafwijking.
Afhankelijk van het teken van de Pearson-asymmetriecoëfficiënt zal de verdeling dus symmetrisch of asymmetrisch zijn:
- Als de Pearson-scheefheidscoëfficiënt positief is, betekent dit dat de verdeling positief scheef is.
- Als de Pearson-scheefheidscoëfficiënt negatief is, betekent dit dat de verdeling negatief scheef is.
- Als de Pearson-scheefheidscoëfficiënt nul is, betekent dit dat de verdeling symmetrisch is.
De Pearson-coëfficiënt kan echter alleen worden berekend als de verdeling unimodaal is, anders is het noodzakelijk om de Fisher-asymmetriecoëfficiënt te gebruiken, waarvan de formule als volgt is:
Goud
het rekenkundig gemiddelde,
de standaarddeviatie en
het totale aantal gegevens.
De interpretatie van de Fisher-asymmetriecoëfficiënt is identiek aan de Pearson-coëfficiënt: als deze positief is, betekent dit dat de verdeling positief asymmetrisch is, als deze negatief is, is de verdeling negatief asymmetrisch, en als deze nul is, betekent dit dat de verdeling is symmetrisch.