Asymmetrie (statistieken)
In dit artikel wordt uitgelegd wat scheefheid in de statistiek betekent. Zo vindt u de definitie van asymmetrie in de statistiek, wat de verschillende soorten asymmetrie zijn, hoe de asymmetriecoëfficiënt wordt berekend en hoe deze wordt geïnterpreteerd.
Wat is asymmetrie in de statistiek?
In de statistiek is scheefheid een maatstaf die de mate van symmetrie (of asymmetrie) van een verdeling ten opzichte van het gemiddelde aangeeft. Simpel gezegd is scheefheid een statistische parameter die wordt gebruikt om de mate van symmetrie (of asymmetrie) van een verdeling te bepalen zonder dat deze grafisch hoeft te worden weergegeven.
Een scheve verdeling is dus een verdeling die een ander aantal waarden links van het gemiddelde heeft dan die rechts. Aan de andere kant zijn er bij een symmetrische verdeling hetzelfde aantal waarden links en rechts van het gemiddelde.
De exponentiële verdeling is bijvoorbeeld asymmetrisch en de normale verdeling is symmetrisch.
Soorten asymmetrie
In de statistiek zijn er drie soorten asymmetrie :
- Positieve asymmetrie : De verdeling heeft meer verschillende waarden rechts van het gemiddelde dan links ervan.
- Symmetrie : De verdeling heeft hetzelfde aantal waarden links van het gemiddelde als rechts van het gemiddelde.
- Negatieve scheefheid : de verdeling heeft meer verschillende waarden links van het gemiddelde dan rechts ervan.
Asymmetriecoëfficiënt
De scheefheidscoëfficiënt , of asymmetrie-index , is een statistische coëfficiënt die helpt bij het bepalen van de asymmetrie van een verdeling. Door de asymmetriecoëfficiënt te berekenen, kunt u dus het type asymmetrie van de verdeling kennen zonder dat u er een grafische weergave van hoeft te maken.
Hoewel er verschillende formules zijn om de asymmetriecoëfficiënt te berekenen, en we zullen ze hieronder allemaal zien, gebeurt de interpretatie van de asymmetriecoëfficiënt, ongeacht de gebruikte formule, altijd als volgt:
- Als de scheefheidscoëfficiënt positief is, is de verdeling positief scheef .
- Als de scheefheidscoëfficiënt nul is, is de verdeling symmetrisch .
- Als de scheefheidscoëfficiënt negatief is, is de verdeling negatief scheef .
Fisher’s asymmetriecoëfficiënt
De scheefheidscoëfficiënt van Fisher is gelijk aan het derde moment rond het gemiddelde gedeeld door de standaarddeviatie van de steekproef. Daarom is de formule voor de asymmetriecoëfficiënt van Fisher :
Op equivalente wijze kan een van de volgende twee formules worden gebruikt om de Fisher-coëfficiënt te berekenen:
Goud
is een wiskundige hoop,
het rekenkundig gemiddelde,
de standaarddeviatie en
het totale aantal gegevens.
Aan de andere kant, als de gegevens gegroepeerd zijn, kunt u de volgende formule gebruiken:
Waar in dit geval
Het is het teken van klasse en
de absolute frequentie van de cursus.
Pearson’s asymmetriecoëfficiënt
De scheefheidscoëfficiënt van Pearson is gelijk aan het verschil tussen het steekproefgemiddelde en de steekproefmodus gedeeld door de standaardafwijking (of standaardafwijking). De formule voor de Pearson-asymmetriecoëfficiënt is daarom als volgt:
Goud
is de Pearson-coëfficiënt,
het rekenkundig gemiddelde,
mode en
de standaardafwijking.
Houd er rekening mee dat de Pearson-scheefheidscoëfficiënt alleen kan worden berekend als het een unimodale verdeling is, dat wil zeggen als er slechts één modus in de gegevens aanwezig is.
Sommige auteurs gebruiken de mediaan in plaats van de modus om de Pearson-scheefheidscoëfficiënt te berekenen, maar over het algemeen wordt de bovenstaande formule gebruikt.
Bowley’s asymmetriecoëfficiënt
De scheefheidscoëfficiënt van Bowley is gelijk aan de som van het derde kwartiel plus het eerste kwartiel minus tweemaal de mediaan gedeeld door het verschil tussen het derde en het eerste kwartiel. De formule voor deze asymmetriecoëfficiënt is daarom als volgt:
Goud
En
Dit zijn respectievelijk het eerste en derde kwartiel en
is de mediaan van de verdeling.
Bedenk dat de mediaan van een verdeling samenvalt met het tweede kwartiel.
Waarvoor wordt asymmetrie gebruikt in de statistiek?
Om de betekenis van asymmetrie in de statistiek volledig te begrijpen, gaan we kijken hoe dit kenmerk van een verdeling wordt berekend.
Scheefheid wordt voornamelijk gebruikt om de vorm van een kansverdeling te kennen, omdat je door het berekenen van de scheefheidscoëfficiënt kunt weten of het een negatief asymmetrische, positief asymmetrische of symmetrische verdeling is zonder dat je de grafische weergave ervan hoeft te doen.
Bovendien wordt scheefheid, samen met kurtosis, gebruikt om te bepalen of een dataset een normale verdeling kan benaderen. Met andere woorden, de scheefheidscoëfficiënt en de kurtosis-coëfficiënt worden berekend om te controleren of een gegevensreeks voldoet aan de aannames van een normale verdeling. Als dat zo is, blijkt dit zeer nuttig te zijn omdat het impliceert dat veel statistische stellingen kunnen worden toegepast.