Pearson's scheefheidscoëfficiënt in excel (stap voor stap)


De Pearson-scheefheidscoëfficiënt , ontwikkeld door biostatisticus Karl Pearson , is een manier omde scheefheid in een voorbeeldgegevensset te meten.

Er zijn eigenlijk twee methoden die kunnen worden gebruikt om de Pearson-scheefheidscoëfficiënt te berekenen:

Methode 1: Gebruik modus

Scheefheid = (gemiddelde – modus) / standaarddeviatie van monster

Methode 2: Gebruik van de mediaan

Scheefheid = 3 (gemiddelde – mediaan) / standaardafwijking van de steekproef

Over het algemeen heeft de tweede methode de voorkeur omdat de modus niet altijd een goede indicatie is van waar de „centrale“ waarde van een dataset ligt en er meer dan één modus in een set gegeven gegevens kan zijn.

In het volgende stapsgewijze voorbeeld ziet u hoe u beide versies van de Pearson-scheefheidscoëfficiënt voor een bepaalde gegevensset in Excel kunt berekenen.

Stap 1: Maak de gegevensset

Laten we eerst de volgende gegevensset in Excel maken:

Stap 2: Bereken de scheefheidscoëfficiënt van Pearson (met behulp van de modus)

Vervolgens kunnen we de volgende formule gebruiken om de Pearson-scheefheidscoëfficiënt te berekenen met behulp van de modus:

Pearson-scheefheidscoëfficiënt in Excel

De scheefheid blijkt 1,295 te zijn.

Stap 3: Bereken de Pearson Skewness Coëfficiënt (met behulp van de mediaan)

We kunnen ook de volgende formule gebruiken om de Pearson-scheefheidscoëfficiënt te berekenen met behulp van de mediaan:

Pearson's scheefheidscoëfficiënt in Excel met behulp van Mediaan

De asymmetrie blijkt 0,569 te zijn.

Hoe asymmetrie te interpreteren

We interpreteren de Pearson-asymmetriecoëfficiënt op de volgende manieren:

  • Een waarde van 0 geeft aan dat er geen asymmetrie is. Als we een histogram zouden maken om de verdeling van waarden in een dataset te visualiseren, zou het perfect symmetrisch zijn.
  • Een positieve waarde duidt op een positieve kanteling of een “rechtse” kanteling. Een histogram zou een ‘staart’ aan de rechterkant van de verdeling onthullen.
  • Een negatieve waarde duidt op een negatieve kanteling of een “linkse” kanteling. Een histogram zou een ‘staart’ aan de linkerkant van de verdeling onthullen.

In ons vorige voorbeeld was de scheefheid positief, wat aangeeft dat de verdeling van gegevenswaarden positief scheef of ‘goed’ was.

Aanvullende bronnen

Bekijkdit artikel voor een mooie uitleg van scheve verdelingen naar links en naar rechts.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert