Betrouwbaarheidsinterval

In dit artikel wordt uitgelegd wat een betrouwbaarheidsinterval in statistieken is en waarvoor het wordt gebruikt. Ook vindt u de factoren die betrouwbaarheidsintervallen beïnvloeden en hoe een betrouwbaarheidsinterval wordt berekend.

Wat is een betrouwbaarheidsinterval?

In de statistiek is het betrouwbaarheidsinterval een interval dat een benadering geeft van de waarden waartussen de waarde van een populatieparameter verband houdt met een bepaald niveau van betrouwbaarheid. De meest voorkomende betrouwbaarheidsintervallen hebben een betrouwbaarheidsniveau van 95% of 99%.

Als het betrouwbaarheidsinterval voor het gemiddelde van een populatie met een betrouwbaarheidsniveau van 95% bijvoorbeeld (3,7) is, betekent dit dat het gemiddelde van de bestudeerde populatie tussen 3 en 7 zal liggen met een waarschijnlijkheid van 95%.

Daarom wordt het betrouwbaarheidsinterval gebruikt om twee waarden te schatten waartussen een populatieparameter ligt. Over het algemeen zijn de waarden van de populatieparameters onbekend, dus wordt een betrouwbaarheidsinterval berekend op basis van de gegevens in een steekproef om een schatting te krijgen van de populatieparameters.

Factoren die het betrouwbaarheidsinterval beïnvloeden

Zodra we de definitie van het betrouwbaarheidsinterval hebben gezien, zullen we zien van welke factoren betrouwbaarheidsintervallen afhankelijk zijn om het concept beter te begrijpen.

  • Steekproefomvang : het aantal onderzochte waarnemingen beïnvloedt de nauwkeurigheid van het betrouwbaarheidsinterval, aangezien hoe meer gegevens we hebben, hoe beter een waarde kan worden geschat. Over het algemeen geldt: hoe groter de steekproefomvang, hoe kleiner de breedte van het betrouwbaarheidsinterval.
  • Foutmarge : hoe groter de toegestane fout, hoe groter het betrouwbaarheidsinterval, en dus hoe waarschijnlijker het is dat de werkelijke waarde van de parameter binnen het betrouwbaarheidsinterval ligt. De foutmarge vermindert echter de nauwkeurigheid van het betrouwbaarheidsinterval.
  • Betrouwbaarheidsniveau : is de kans dat de schatting van de populatiestatistiek binnen het betrouwbaarheidsinterval ligt. Normaal gesproken wordt het betrouwbaarheidsniveau van een interval aangegeven als 1-α en uitgedrukt als een percentage. Een hoog betrouwbaarheidsniveau vergroot de kans dat de werkelijke waarde tussen de intervalgrenzen ligt, maar vergroot ook de breedte van het interval.
  • De geschatte parameter : het betrouwbaarheidsinterval hangt af van de te benaderen parameter. In feite hangt de formule die moet worden gebruikt om het betrouwbaarheidsinterval te berekenen, af van de geschatte parameter.

Hoe het betrouwbaarheidsinterval te berekenen

De formule die moet worden toegepast om elk type betrouwbaarheidsinterval te berekenen, wordt hieronder weergegeven, omdat de te gebruiken formule verschillend is, afhankelijk van of we het betrouwbaarheidsinterval voor het gemiddelde, de variantie of de proportie willen bepalen.

Betrouwbaarheidsinterval voor het gemiddelde

Uitgaande van het feit dat het proces van het typen van een variabele als volgt verloopt:

Z=\cfrac{X-\mu}{\displaystyle\frac{\sigma}{\sqrt{n}}} \sim N(0,1)

Het betrouwbaarheidsinterval voor het gemiddelde wordt berekend door het optellen en aftrekken van het steekproefgemiddelde van de waarde van Z α/2 vermenigvuldigd met de standaarddeviatie (σ) en gedeeld door de vierkantswortel van de omvang van de steekproef (n). Daarom is de formule voor het berekenen van het betrouwbaarheidsinterval van het gemiddelde:

\displaystyle \left(\overline{x}-z_{\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} \ , \ \overline{x}+z_{\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} \right)

Voor grote steekproeven en een betrouwbaarheidsniveau van 95% is de kritische waarde Z α/2 = 1,96 en voor een betrouwbaarheidsniveau van 99% is de kritische waarde Z α/2 = 2,576.

De bovenstaande formule wordt gebruikt als de populatievariantie bekend is. Als de populatievariantie echter onbekend is, wat het meest voorkomende geval is, wordt het betrouwbaarheidsinterval voor het gemiddelde berekend met behulp van de volgende formule:

\displaystyle \left(\overline{x}-t_{\alpha/2}\cdot \frac{s}{\sqrt{n}} \ , \ \overline{x}+t_{\alpha/2}\cdot \frac{s}{\sqrt{n}} \right)

Goud:

  • \overline{x}

    is het steekproefgemiddelde.

  • t_{\alpha/2}

    is de waarde van de Student’s t-verdeling van n-1 vrijheidsgraden met waarschijnlijkheid α/2.

  • s

    is de standaardafwijking van het monster.

  • n

    is de steekproefomvang.

Betrouwbaarheidsinterval

Betrouwbaarheidsinterval voor variantie

Om het betrouwbaarheidsinterval voor de variantie van een populatie te berekenen, wordt de chikwadraatverdeling gebruikt. Meer specifiek is de formule voor het berekenen van het betrouwbaarheidsinterval voor de variantie :

\displaystyle \left( (n-1)\frac{s^2}{\chi_{n-1;\alpha/2}} \ , \ (n-1)\frac{s^2}{\chi_{n-1;1-\alpha/2}}\right)

Goud:

  • n

    is de steekproefomvang.

  • s

    is de standaardafwijking van het monster.

  • \chi_{n-1;\alpha/2}

    is de waarde van de Chi-kwadraatverdeling met n-1 vrijheidsgraden voor een waarschijnlijkheid kleiner dan α/2.

  • \chi_{n-1;1-\alpha/2}

    is de waarde van de Chi-kwadraatverdeling met n-1 vrijheidsgraden voor een waarschijnlijkheid groter dan 1-α/2.

Betrouwbaarheidsinterval voor proportie

Het betrouwbaarheidsinterval voor het aandeel wordt berekend door het optellen en aftrekken van het steekproefaandeel van de waarde van Z α/2 vermenigvuldigd met de vierkantswortel van het steekproefaandeel (p), vermenigvuldigd met 1-p en gedeeld door de steekproefomvang (n). Daarom is de formule voor het berekenen van het betrouwbaarheidsinterval voor het aandeel :

\displaystyle \left(p-Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\ , \ p+Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\right)

Goud:

  • p

    is de steekproefaandeel.

  • n

    is de steekproefomvang.

  • Z_{\alpha/2}

    is het kwantiel van de standaardnormale verdeling dat overeenkomt met een waarschijnlijkheid van α/2. Voor grote steekproeven en een betrouwbaarheidsniveau van 95% ligt dit gewoonlijk dicht bij 1,96 en voor een betrouwbaarheidsniveau van 99% ligt het gewoonlijk dicht bij 2,576.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert