Asymmetrie en afvlakking

In dit artikel wordt uitgelegd wat scheefheid en kurtosis in statistieken zijn. U vindt dus de definitie van deze twee concepten, hoe u scheefheid en kurtosis kunt berekenen, wat hun formules zijn, evenals een online rekenmachine om scheefheid en kurtosis van elk gegevensmonster te berekenen.

Wat zijn scheefheid en kurtosis?

Scheefheid en kurtosis zijn twee statistische maatstaven die worden gebruikt om de vorm van een verdeling te beschrijven zonder deze in een grafiek te hoeven zetten. Meer specifiek geeft scheefheid de mate van symmetrie (of scheefheid) van een verdeling aan, terwijl kurtosis de mate van concentratie van een verdeling rond het gemiddelde aangeeft.

In de statistiek worden scheefheid en kurtosis ook wel vormmetingen genoemd.

👉 U kunt de onderstaande online calculator gebruiken om de scheefheid en kurtosis van elke dataset te berekenen.

Asymmetrie

In de statistiek is scheefheid een maatstaf die de mate van symmetrie (of asymmetrie) van een verdeling ten opzichte van het gemiddelde aangeeft. Simpel gezegd is scheefheid een statistische parameter die wordt gebruikt om de mate van symmetrie (of asymmetrie) van een verdeling te bepalen zonder dat deze grafisch hoeft te worden weergegeven.

Een asymmetrische verdeling is dus een verdeling die een ander aantal waarden links van het gemiddelde heeft dan één aan de rechterkant. Aan de andere kant zijn er bij een symmetrische verdeling hetzelfde aantal waarden links en rechts van het gemiddelde.

We onderscheiden dus drie soorten asymmetrie :

  • Positieve asymmetrie : De verdeling heeft meer verschillende waarden rechts van het gemiddelde dan links ervan.
  • Symmetrie : De verdeling heeft hetzelfde aantal waarden links van het gemiddelde als rechts van het gemiddelde.
  • Negatieve scheefheid : de verdeling heeft meer verschillende waarden links van het gemiddelde dan rechts ervan.
vormen van asymmetrie

asymmetriecoëfficiënt

De scheefheidscoëfficiënt , of asymmetrie-index , is een statistische coëfficiënt die helpt bij het bepalen van de asymmetrie van een verdeling. Door de asymmetriecoëfficiënt te berekenen, is het dus mogelijk om te weten welk type asymmetrie de verdeling vertoont, zonder deze grafisch weer te geven.

Hoewel er verschillende formules zijn om de asymmetriecoëfficiënt te berekenen, en we zullen ze hieronder allemaal zien, gebeurt de interpretatie van de asymmetriecoëfficiënt, ongeacht de gebruikte formule, altijd als volgt:

  • Als de scheefheidscoëfficiënt van positief is, is de verdeling positief scheef .
  • Als de asymmetriecoëfficiënt van gelijk is aan nul, is de verdeling symmetrisch .
  • Als de scheefheidscoëfficiënt van negatief is, is de verdeling negatief scheef .

Fisher’s asymmetriecoëfficiënt

De scheefheidscoëfficiënt van Fisher is gelijk aan het derde moment rond het gemiddelde gedeeld door de standaarddeviatie van de steekproef. Daarom is de formule voor de asymmetriecoëfficiënt van Fisher :

\displaystyle\gamma_1=\frac{\mu_3}{\sigma^3}

Op equivalente wijze kan een van de volgende twee formules worden gebruikt om de Fisher-coëfficiënt te berekenen:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3}{N\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}

Goud

E

is de wiskundige verwachting,

\mu

het rekenkundig gemiddelde,

\sigma

de standaarddeviatie en

N

het totale aantal gegevens.

Aan de andere kant, als de gegevens gegroepeerd zijn, kunt u de volgende formule gebruiken:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3\cdot f_i}{N\cdot \sigma ^3}

Waar in dit geval

x_i

Het is het teken van klasse en

f_i

de absolute frequentie van de cursus.

Pearson’s asymmetriecoëfficiënt

De scheefheidscoëfficiënt van Pearson is gelijk aan het verschil tussen het steekproefgemiddelde en de steekproefmodus gedeeld door de standaardafwijking (of standaardafwijking). De formule voor de Pearson-asymmetriecoëfficiënt is daarom als volgt:

A_p=\cfrac{\mu-Mo}{\sigma}

Goud

A_p

is de Pearson-coëfficiënt,

\mu

het rekenkundig gemiddelde,

Mo

mode en

\sigma

de standaardafwijking.

Houd er rekening mee dat de Pearson-scheefheidscoëfficiënt alleen kan worden berekend als het een unimodale verdeling is, dat wil zeggen als er slechts één modus in de gegevens aanwezig is.

Bowley’s asymmetriecoëfficiënt

De scheefheidscoëfficiënt van Bowley is gelijk aan de som van het derde kwartiel plus het eerste kwartiel minus tweemaal de mediaan gedeeld door het verschil tussen het derde en het eerste kwartiel. De formule voor deze asymmetriecoëfficiënt is daarom als volgt:

A_B=\cfrac{Q_3+Q_1-2\cdot Me}{Q_3-Q_1}

Goud

Q_1

En

Q_3

Dit zijn respectievelijk het eerste en derde kwartiel en

Me

is de mediaan van de verdeling.

Afvlakking

Kurtosis , ook wel scheefheid genoemd, geeft aan hoe geconcentreerd een verdeling rond het gemiddelde is. Met andere woorden, kurtosis geeft aan of een verdeling steil of vlak is. Concreet geldt: hoe groter de kurtosis van een verdeling, hoe steiler (of scherper) deze is.

vleiend

Er zijn drie soorten vleierij :

  • Leptokurtisch : de verdeling is zeer puntig, dat wil zeggen dat de gegevens sterk geconcentreerd zijn rond het gemiddelde. Nauwkeuriger gezegd: leptokurtische verdelingen worden gedefinieerd als verdelingen die scherper zijn dan de normale verdeling.
  • Mesokurtisch : De kurtosis van de verdeling is equivalent aan de kurtosis van de normale verdeling. Daarom wordt het niet als scherp of gevleid beschouwd.
  • Platykurtic : de verdeling is zeer vlak, dat wil zeggen dat de concentratie rond het gemiddelde laag is. Formeel worden platykurtische verdelingen gedefinieerd als die verdelingen die vlakker zijn dan de normale verdeling.

Merk op dat de verschillende soorten kurtosis worden gedefinieerd door de kurtosis van de normale verdeling als referentie te nemen.

vormen van vleierij

kurtosis-coëfficiënt

De formule voor de kurtosis-coëfficiënt is als volgt:

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N(x_i-\mu)^4}{\sigma^4}-3

De formule voor de kurtosis-coëfficiënt voor gegevens gegroepeerd in frequentietabellen :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(x_i-\mu)^4}{\sigma^4}-3

Tenslotte de formule voor de kurtosis-coëfficiënt voor gegevens gegroepeerd in intervallen :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(c_i-\mu)^4}{\sigma^4}-3

Goud:

  • g_2

    is de kurtosis-coëfficiënt.

  • N

    is het totale aantal gegevens.

  • x_i

    is het i-de gegevenspunt in de reeks.

  • \mu

    is het rekenkundig gemiddelde van de verdeling.

  • \sigma

    is de standaardafwijking (of typische afwijking) van de verdeling.

  • f_i

    is de absolute frequentie van de it-gegevensset.

  • c_i

    is het klassekenmerk van de i-de groep.

Merk op dat in alle formules voor de kurtosis-coëfficiënt 3 wordt afgetrokken omdat dit de kurtosis-waarde van de normale verdeling is. De berekening van de kurtosis-coëfficiënt wordt dus gedaan door de kurtosis van de normale verdeling als referentie te nemen. Dit is de reden waarom soms in de statistieken wordt gezegd dat overmatige kurtosis wordt berekend.

Nadat de kurtosis-coëfficiënt is berekend, moet deze als volgt worden geïnterpreteerd om te identificeren welk type kurtosis het is:

  • Als de kurtosis-coëfficiënt positief is, betekent dit dat de verdeling leptokurtisch is.
  • Als de kurtosis-coëfficiënt nul is, betekent dit dat de verdeling mesokurtisch is.
  • Als de kurtosis-coëfficiënt negatief is, betekent dit dat de verdeling platykurtisch is.

Scheefheids- en Kurtosis-calculator

Voer een gegevensset in de volgende rekenmachine in om de scheefheid en kurtosis-coëfficiënt ervan te berekenen en ook te bepalen welk type verdeling het is. Gegevens moeten worden gescheiden door een spatie en moeten worden ingevoerd met de punt als decimaal scheidingsteken.

Waar worden asymmetrie en kurtosis voor gebruikt?

Ten slotte zullen we zien waarvoor scheefheid en kurtosis in statistieken worden gebruikt en hoe deze twee soorten statistische parameters worden geïnterpreteerd.

Skewness en kurtosis worden gebruikt om de vorm van een kansverdeling te definiëren zonder deze grafisch weer te geven. Dat wil zeggen dat scheefheid en kurtosis worden berekend om te bepalen welk type verdeling het is, zonder dat het in een grafiek hoeft te worden weergegeven, wat doorgaans veel tijd en moeite kost.

Bovendien worden scheefheids- en kurtosis-waarden gebruikt om de curve van een verdeling te vergelijken met een normale verdeling. Want als ze vergelijkbaar zijn, betekent dit dat de te bestuderen verdeling kan worden benaderd tot een normale verdeling en dat er daarom verschillende statistische stellingen kunnen worden toegepast.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert