Verspreidingsmetingen

In dit artikel leert u wat spreidingsmaatstaven zijn en waarvoor deze statistische maatstaven worden gebruikt. Bovendien kunt u zien hoe elke spreidingsmaatstaf wordt berekend.

Wat zijn spreidingsmaatregelen?

Verspreidingsmetingen zijn statistische metingen die de spreiding van een dataset aangeven. Dat wil zeggen dat spreidingsmaten worden gebruikt om de mate van spreiding van gegevens in een steekproef te beoordelen.

Verspreidingsmaatstaven worden ook wel variabiliteitsmaatstaven of spreidingsmaatstaven genoemd.

Wat zijn de spreidingsmaatregelen?

De spreidingsmaatregelen zijn als volgt:

  • Standaardafwijking (of standaardafwijking)
  • Variantie
  • Variatiecoëfficiënt
  • Netjes
  • Interkwartielbereik
  • Middelmatig verschil

Hieronder wordt uitgelegd hoe u elke spreidingsmaatstaf kunt bepalen.

Standaardafwijking

De standaardafwijking , ook wel de typische afwijking genoemd, is gelijk aan de vierkantswortel van de som van de kwadraten van de afwijkingen van de gegevensreeks gedeeld door het totale aantal waarnemingen.

De formule voor deze spreidingsmaatregel is daarom als volgt:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Variantie

De variantie is gelijk aan de som van de kwadraten van de residuen over het totale aantal waarnemingen. De formule voor deze spreidingsmetriek is daarom als volgt:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Goud:

  • X

    is de willekeurige variabele waarvoor u de variantie wilt berekenen.

  • x_i

    is de gegevenswaarde

    i

    .

  • n

    is het totale aantal waarnemingen.

  • \overline{X}

    is het gemiddelde van de willekeurige variabele

    X

    .

Variatiecoëfficiënt

In de statistiek is de variatiecoëfficiënt een maatstaf voor de spreiding die wordt gebruikt om de spreiding van een gegevensset ten opzichte van het gemiddelde te bepalen. De variatiecoëfficiënt wordt berekend door de standaarddeviatie van de gegevens te delen door het gemiddelde en vervolgens te vermenigvuldigen met 100 om de waarde als een percentage uit te drukken.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Netjes

Bereik is een spreidingsmaatstaf die het verschil aangeeft tussen de maximale en minimale waarde van gegevens in een steekproef. Om de omvang van een populatie of statistische steekproef te berekenen, moet daarom de maximale waarde worden afgetrokken van de minimumwaarde.

R=\text{M\'ax}-\text{M\'in}

Interkwartielbereik

Het interkwartielbereik , ook wel interkwartielbereik genoemd, is een maatstaf voor de statistische spreiding die het verschil tussen het derde en eerste kwartiel aangeeft.

Om het interkwartielbereik van een statistische dataset te berekenen, moet u daarom eerst het derde en eerste kwartiel vinden en deze vervolgens aftrekken.

IQR=Q_3-Q_1

Het symbool voor de interkwartielafstand is IQR, afkomstig van de Engelse interkwartielafstand .

Een van de meest voordelige kenmerken van deze spreidingsmaatstaf is dat het een robuuste statistiek is, dat wil zeggen dat het een hoge robuustheid heeft ten opzichte van uitschieters. Omdat bij de berekening van het interkwartielbereik geen rekening wordt gehouden met extreme waarden, zal de waarde ervan zeer weinig variëren als er nieuwe uitschieters verschijnen.

Middelgroot verschil

De gemiddelde afwijking , ook wel de gemiddelde absolute afwijking genoemd, is het gemiddelde van de absolute afwijkingen. De gemiddelde afwijking is daarom gelijk aan de som van de afwijkingen van elk gegevensitem van het rekenkundig gemiddelde gedeeld door het totale aantal gegevensitems.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

Waar worden dispersiemetingen voor gebruikt?

Dispersiemetingen worden gebruikt om de spreiding van een statistische steekproef te evalueren. Dat wil zeggen dat dispersiemetingen ons in staat stellen de spreiding van een dataset te kwantificeren en, op basis van de verkregen waarden, de spreiding van het gegevensmonster kan worden geanalyseerd.

Verspreidingsmaten worden veel gebruikt omdat ze helpen bij het beschrijven van een steekproef van gegevens. Verspreidingsmetingen helpen begrijpen hoe een gegevensreeks eruit ziet.

Andere statistische metingen die ook vaak worden berekend, zijn metingen van de centrale tendens en positiemetingen. Doorgaans wordt er niet één enkele statistische meting bepaald, maar worden er meerdere metingen uitgevoerd om beter te begrijpen hoe de bestudeerde gegevens eruit zien.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert