Variabiliteitsmetingen
In dit artikel wordt uitgelegd wat variabiliteitsmetingen zijn en waarvoor dit soort statistische metingen worden gebruikt. U vindt hier dus de definitie van een variabiliteitsmaatstaf, wat de verschillende soorten variabiliteitsmaatstaven zijn en hoe variabiliteitsmaatstaven worden berekend.
Wat zijn variabiliteitsmetingen?
Variabiliteitsmetingen zijn statistische metingen die de variabiliteit van een dataset aangeven. Met andere woorden: variabiliteitsmetingen meten de spreiding van een gegevensreeks.
Daarom worden variabiliteitsmetingen gebruikt om de spreiding van waarden in een steekproef te kennen. Hoe hoger de waarde van een variabiliteitsmaatstaf, dit betekent dat de gegevens in de steekproef verder uit elkaar liggen. Over het algemeen is het belangrijk dat gegevensmonsters dicht bij elkaar liggen, dus normaal gesproken proberen we variabiliteitsmetingen te minimaliseren.
In de statistiek zijn variabiliteitsmetingen belangrijk omdat ze ons in staat stellen de representativiteit van een centralisatiemaatstaf voor de dataset te kennen. Als de waarden van de variabiliteitsmetingen laag zijn, betekent dit dat de gegevens zeer geconcentreerd zijn en daarom beschrijven de centralisatiemetingen de hele gegevens goed.
Variabiliteitsmaatstaven kunnen ook spreidingsmaatstaven of spreidingsmaatstaven worden genoemd.
Wat zijn de maatstaven van variabiliteit?
De variabiliteitsmetingen zijn als volgt:
- Standaardafwijking (of standaardafwijking)
- Variantie
- Variatiecoëfficiënt
- Netjes
- Interkwartielbereik
- gemiddeld verschil
Hieronder wordt uitgelegd hoe u elk type variabiliteitsmaatstaf kunt berekenen
Standaardafwijking
De standaardafwijking , ook wel de typische afwijking genoemd, is gelijk aan de vierkantswortel van de som van de kwadraten van de afwijkingen van de gegevensreeks gedeeld door het totale aantal waarnemingen.
Daarom is de formule voor deze maatstaf voor variabiliteit als volgt:
Variantie
De variantie is gelijk aan de som van de kwadraten van de residuen over het totale aantal waarnemingen. De formule voor deze variabiliteitsmetriek is daarom als volgt:
Goud:
-
is de willekeurige variabele waarvoor u de variantie wilt berekenen.
-
is de gegevenswaarde
.
-
is het totale aantal waarnemingen.
-
is het gemiddelde van de willekeurige variabele
.
Variatiecoëfficiënt
In de statistiek is de variatiecoëfficiënt een maatstaf voor de variabiliteit die wordt gebruikt om de spreiding van een gegevensset ten opzichte van het gemiddelde te bepalen. De variatiecoëfficiënt wordt berekend door de standaarddeviatie van de gegevens te delen door het gemiddelde en vervolgens te vermenigvuldigen met 100 om de waarde als een percentage uit te drukken.
Netjes
Bereik is een maatstaf voor de variabiliteit die het verschil aangeeft tussen de maximale en minimale waarde van gegevens in een steekproef. Om de omvang van een populatie of statistische steekproef te berekenen, moet daarom de maximale waarde worden afgetrokken van de minimumwaarde.
Interkwartielbereik
Het interkwartielbereik , ook wel interkwartielbereik genoemd, is een maatstaf voor de statistische variabiliteit die het verschil tussen het derde en eerste kwartiel aangeeft.
Om het interkwartielbereik van een statistische dataset te berekenen, moet u daarom eerst het derde en eerste kwartiel vinden en deze vervolgens aftrekken.
Het symbool voor de interkwartielafstand is IQR, afkomstig van de Engelse interkwartielafstand .
Een van de meest voordelige kenmerken van deze variabiliteitsmaatstaf is dat het een robuuste statistiek is, dat wil zeggen dat het een hoge robuustheid heeft ten aanzien van uitschieters. Omdat bij de berekening van het interkwartielbereik geen rekening wordt gehouden met extreme waarden, zal de waarde ervan zeer weinig variëren als er nieuwe uitschieters verschijnen.
gemiddeld verschil
De gemiddelde afwijking , ook wel de gemiddelde absolute afwijking genoemd, is het gemiddelde van de absolute afwijkingen. De gemiddelde afwijking is daarom gelijk aan de som van de afwijkingen van elk gegevensitem van het rekenkundig gemiddelde gedeeld door het totale aantal gegevensitems.