Statistische formules

Hier vindt u de belangrijkste statistische formules. We laten u ook gekoppeld aan onze artikelen waarin u voorbeelden van de toepassing van elke statistische formule kunt zien en bovendien kunt u een online rekenmachine gebruiken, zodat u de berekeningen niet hoeft uit te voeren en het resultaat van de formule direct kent.

Formules voor statistische metingen van centrale tendens

Half

Om het gemiddelde te berekenen, telt u alle waarden bij elkaar op en deelt u deze door het totale aantal gegevens. De formule voor het gemiddelde is daarom als volgt:

\displaystyle\overline{x}=\frac{\displaystyle\sum_{i=1}^n x_i}{n}

In de statistiek wordt het gemiddelde ook wel het rekenkundig gemiddelde of gemiddelde genoemd.

Mediaan

De mediaan is de middelste waarde van alle gegevens, gerangschikt van klein naar groot. Met andere woorden: de mediaan verdeelt de geordende dataset in twee gelijke delen.

De berekening van de mediaan hangt af van het feit of het totale aantal gegevens even of oneven is:

  • Als het totale aantal gegevens oneven is, is de mediaan de waarde die precies in het midden van de gegevens valt. Dat wil zeggen de waarde die zich op positie (n+1)/2 van de gesorteerde gegevens bevindt.
  • Me=x_{\frac{n+1}{2}

  • Als het totale aantal gegevenspunten even is, is de mediaan het gemiddelde van de twee gegevenspunten in het midden. Dat wil zeggen het rekenkundig gemiddelde van de waarden die gevonden worden op posities n/2 en n/2+1 van de geordende data.
  • Me=\cfrac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}

Goud

n

is het totale aantal gegevens in de steekproef en het symbool Me geeft de mediaan aan.

Mode

In de statistiek is de modus de waarde in de dataset die de hoogste absolute frequentie heeft, dat wil zeggen dat de modus de meest herhaalde waarde in een dataset is.

Daarom is er geen specifieke formule voor de modus, maar om de modus van een statistische gegevensset te berekenen, telt u eenvoudigweg het aantal keren dat elk gegevenselement in de steekproef voorkomt, en de gegevens die het meest worden herhaald, zullen de modus zijn.

Er kan ook worden gezegd dat de modus een statistische modus of modale waarde is.

Zie: Modecalculator

Formules voor statistische metingen van spreiding

Standaardafwijking

De standaarddeviatie, ook wel de standaarddeviatie genoemd, is gelijk aan de vierkantswortel van de som van de kwadraten van de afwijkingen van de gegevensreeks gedeeld door het totale aantal waarnemingen.

Daarom is de formule voor standaarddeviatie :

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^n(x_i-\overline{x})^2}{n}}

Variantie

De variantie is gelijk aan de som van de kwadraten van de residuen over het totale aantal waarnemingen. De formule voor deze statistische metriek is daarom als volgt:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Goud:

  • X

    is de willekeurige variabele waarvoor u de variantie wilt berekenen.

  • x_i

    is de gegevenswaarde

    i

    .

  • n

    is het totale aantal waarnemingen.

  • \overline{X}

    is het gemiddelde van de willekeurige variabele

    X

    .

Zie: Gatcalculator

Variatiecoëfficiënt

In de statistiek is de variatiecoëfficiënt een maatstaf voor de spreiding die wordt gebruikt om de spreiding van een gegevensset ten opzichte van het gemiddelde te bepalen. De variatiecoëfficiënt wordt berekend door de standaarddeviatie van de gegevens te delen door het gemiddelde en vervolgens te vermenigvuldigen met 100 om de waarde als een percentage uit te drukken.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Netjes

Statistisch bereik is een spreidingsmaatstaf die het verschil aangeeft tussen de maximale waarde en de minimale waarde van gegevens in een steekproef. Om de omvang van een populatie of statistische steekproef te berekenen, moet daarom de maximale waarde worden afgetrokken van de minimumwaarde.

R=\text{M\'ax}-\text{M\'in}

Interkwartielbereik

Het interkwartielbereik , ook wel interkwartielbereik genoemd, is een maatstaf voor de statistische spreiding die het verschil tussen het derde en eerste kwartiel aangeeft.

Om het interkwartielbereik van een statistische dataset te berekenen, moet u daarom eerst het derde en eerste kwartiel vinden en deze vervolgens aftrekken.

IQR=Q_3-Q_1

gemiddeld verschil

De gemiddelde afwijking , ook wel de gemiddelde absolute afwijking genoemd, is het gemiddelde van de absolute afwijkingen. De gemiddelde afwijking is daarom gelijk aan de som van de afwijkingen van elk gegevensitem van het rekenkundig gemiddelde gedeeld door het totale aantal gegevensitems.

D_{\overline{x}}=\cfrac{\sum_{i=1}^n|x_i-\overline{x}|}{n}

Formules voor statistische positiemetingen

kwartielen

In de statistieken zijn kwartielen de drie waarden die een reeks geordende gegevens in vier gelijke delen verdelen. Het eerste, tweede en derde kwartiel vertegenwoordigen dus respectievelijk 25%, 50% en 75% van alle statistische gegevens.

Kwartielen worden weergegeven door een hoofdletter Q en de kwartielindex, dus het eerste kwartiel is Q 1 , het tweede kwartiel is Q 2 en het derde kwartiel is Q 3 .

De kwartielformule is:

\cfrac{k\cdot (n+1)}{4} \qquad k=1, 2, 3

Let op: deze formule vertelt ons de positie van het kwartiel, niet de waarde van het kwartiel. Het kwartiel zijn de gegevens die zich bevinden op de positie die door de formule wordt verkregen.

Soms geeft het resultaat van deze formule ons echter een decimaal getal. We moeten daarom twee gevallen onderscheiden, afhankelijk van of het resultaat een decimaal getal is of niet:

  • Als het resultaat van de formule een getal zonder decimaal deel is, zijn het kwartiel de gegevens die zich op de positie bevinden die door de bovenstaande formule wordt aangegeven.
  • Als het resultaat van de formule een getal met een decimaal deel is, wordt de kwartielwaarde berekend met behulp van de volgende formule:

Q=x_i+d\cdot (x_{i+1}-x_i)

Waar x i en x i+1 de getallen zijn van de posities waartussen het getal verkregen door de eerste formule zich bevindt, en d het decimale deel is van het getal verkregen door de eerste formule.

decielen

In de statistieken zijn decielen de negen waarden die een reeks geordende gegevens in tien gelijke delen verdelen. Zodat het eerste, tweede, derde,… deciel 10%, 20%, 30%,… van de steekproef of populatie vertegenwoordigt.

Decielen worden weergegeven door de hoofdletter D en de decielindex, dat wil zeggen, het eerste deciel is D 1 , het tweede deciel is D 2 , het derde deciel is D 3 , enz.

De decielformule is als volgt:

\cfrac{k\cdot (n+1)}{10} \qquad k=1, 2, 3,4,5,6,7,8,9

Let op: deze formule vertelt ons de positie van het deciel, niet de waarde van het deciel. Het deciel bestaat uit de gegevens die zich bevinden op de positie die door de formule wordt verkregen.

Soms geeft het resultaat van deze formule ons echter een decimaal getal. We moeten daarom twee gevallen onderscheiden, afhankelijk van of het resultaat een decimaal getal is of niet:

  • Als het resultaat van de formule een getal is zonder een decimaal deel , bestaat het deciel uit de gegevens die zich bevinden op de positie die wordt geboden door de bovenstaande formule.
  • Als het resultaat van de formule een getal met een decimaal deel is, wordt de decielwaarde berekend met behulp van de volgende formule:

D=x_i+d\cdot (x_{i+1}-x_i)

Waar x i en x i+1 de getallen zijn van de posities waartussen het getal verkregen door de eerste formule zich bevindt, en d het decimale deel is van het getal verkregen door de eerste formule.

percentielen

In de statistieken zijn percentielen de waarden die een reeks geordende gegevens in honderd gelijke delen verdelen. Een percentiel geeft dus de waarde aan waaronder een percentage van de dataset valt.

Percentielen worden weergegeven door de hoofdletter P en de percentielindex, dat wil zeggen dat het eerste percentiel P 1 is, het 40e percentiel P 40 , het 79e percentiel P 79 , enz.

De percentielformule is:

\cfrac{k\cdot (n+1)}{100} \qquad k=1, 2, 3,\ldots ,97,98,99

Let op: deze formule vertelt ons de positie van het percentiel, maar niet de waarde ervan. Het percentiel bestaat uit de gegevens die zich bevinden op de positie die door de formule wordt verkregen.

Soms geeft het resultaat van deze formule ons echter een decimaal getal. We moeten daarom twee gevallen onderscheiden, afhankelijk van of het resultaat een decimaal getal is of niet:

  • Als het resultaat van de formule een getal zonder decimaal deel is, komt het percentiel overeen met de gegevens die zich in de positie bevinden die door de bovenstaande formule wordt verstrekt.
  • Als het resultaat van de formule een getal met een decimaal deel is, wordt de exacte percentielwaarde berekend met behulp van de volgende formule:

P=x_i+d\cdot (x_{i+1}-x_i)

Waar x i en x i+1 de getallen zijn van de posities waartussen het getal verkregen door de eerste formule zich bevindt, en d het decimale deel is van het getal verkregen door de eerste formule.

Statistische vormmetingsformules

asymmetriecoëfficiënt

De scheefheidscoëfficiënt, of scheefheidsindex, is een statistische coëfficiënt die wordt gebruikt om de scheefheid van een verdeling te bepalen. Door de asymmetriecoëfficiënt te berekenen, kunt u dus het type asymmetrie van de verdeling kennen zonder dat u er een grafische weergave van hoeft te maken.

De formule voor de asymmetriecoëfficiënt is als volgt:

\displaystyle\gamma_1=\frac{\overline{x}_3}{\sigma^3}

Op equivalente wijze kan een van de volgende twee formules worden gebruikt om de Fisher-asymmetriecoëfficiënt te berekenen:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\overline{x}\right)^3}{n\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\cdot \overline{x}\cdot \sigma^2 - \overline{x}^3}{\sigma^3}

Goud

E

is de wiskundige verwachting,

\overline{x}

het rekenkundig gemiddelde,

\sigma

de standaarddeviatie en

n

het totale aantal gegevens.

kurtosis-coëfficiënt

Kurtosis, ook wel scherpte genoemd, geeft aan hoe geconcentreerd een verdeling rond het gemiddelde is. Met andere woorden, kurtosis geeft aan of een verdeling steil of vlak is. Concreet geldt: hoe groter de kurtosis van een verdeling, hoe steiler (of scherper) deze is.

De formule voor de kurtosis-coëfficiënt is als volgt:

\displaystyle g_2=\frac{1}{n}\cdot\frac{\displaystyle \sum_{i=1}^n(x_i-\overline{x})^4}{\sigma^4}-3

Goud

x_i

is de waarde die overeenkomt met de waarneming

i

,

\overline{x}

het rekenkundig gemiddelde,

\sigma

de standaarddeviatie en

n

het totale aantal gegevens.

Overzichtstabel van alle statistische formules

Ten slotte laten we u een tabel achter die de belangrijkste statistische formules samenvat.

statistische formules

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert