Betrouwbaarheidsinterval voor het verschil in gemiddelden

In dit artikel wordt uitgelegd wat een betrouwbaarheidsinterval voor het verschil in gemiddelden in de statistiek is en waarvoor het wordt gebruikt. U zult dus ontdekken hoe u het betrouwbaarheidsinterval voor het verschil van twee gemiddelden kunt berekenen en een oefening die u stap voor stap kunt oplossen.

Wat is het betrouwbaarheidsinterval voor het verschil in gemiddelden?

Het betrouwbaarheidsinterval voor het verschil in gemiddelden is een interval dat een maximumwaarde en een minimumwaarde oplevert waartussen de waarde van het verschil in gemiddelden van twee populaties met een bepaald betrouwbaarheidsniveau ligt.

Als het betrouwbaarheidsinterval voor het verschil in de gemiddelden van twee populaties met een betrouwbaarheidsniveau van 95% bijvoorbeeld (3,5) is, betekent dit dat het verschil tussen de gemiddelden van de twee populaties tussen 3 en 5 zal liggen met een waarschijnlijkheid van 95. %.

Daarom wordt in de statistieken het betrouwbaarheidsinterval voor het verschil in gemiddelden gebruikt om twee waarden te schatten waartussen het verschil tussen twee populatiegemiddelden ligt. Met behulp van gegevens uit twee steekproeven is het dus mogelijk om het verschil tussen de populatiegemiddelden te benaderen.

Betrouwbaarheidsintervalformule voor verschil in gemiddelden

De formule voor het betrouwbaarheidsinterval voor het verschil in gemiddelden hangt af van het feit of de populatievarianties al dan niet bekend zijn en, zo niet, of kan worden aangenomen dat de populatievarianties gelijk zijn. . Vervolgens zullen we zien hoe het betrouwbaarheidsinterval voor het verschil in gemiddelden telkens wordt berekend.

bekende afwijkingen

De formule voor het berekenen van het betrouwbaarheidsinterval voor het verschil in gemiddelden wanneer de varianties van de twee populaties bekend zijn met een betrouwbaarheidsniveau van 1-α is als volgt:

\displaystyle (\overline{x_1}-\overline{x_2})\pm Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}

Goud:

  • \overline{x_i}

    is het gemiddelde van monster i.

  • \sigma_i

    is de standaarddeviatie van populatie i.

  • Z_{\alpha/2}

    is de waarde van de standaardnormale verdeling met waarschijnlijkheid α/2.

  • n_i

    is de steekproefomvang i.

Dit geval komt het minst vaak voor, omdat de waarde van populatievarianties over het algemeen onbekend is.

onbekende en gelijke varianties

Wanneer de varianties van de twee populaties onbekend zijn, maar geschat kunnen worden als gelijk, is de formule voor het berekenen van het betrouwbaarheidsinterval voor het verschil tussen gemiddelden met een betrouwbaarheidsniveau van 1-α als volgt:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

Goud:

  • \overline{x_i}

    is het gemiddelde van monster i.

  • s_p

    is de gepoolde standaarddeviatie.

  • t_{\alpha/2}

    is de waarde van de Student’s t-verdeling van n 1 + n 2 -2 vrijheidsgraden met een waarschijnlijkheid van α/2.

  • n_i

    is de steekproefomvang i.

Omdat in dit geval wordt aangenomen dat de populatievarianties equivalent zijn, wordt de gecombineerde standaarddeviatie gebruikt om het betrouwbaarheidsinterval te berekenen, dat wordt berekend met de volgende formule:

\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}

Goud

s_i

is de standaardafwijking van monster i.

Onbekende en verschillende varianten

Wanneer de varianties van de twee populaties onbekend zijn en er niet van kan worden uitgegaan dat ze gelijk zijn, is de formule voor het berekenen van het betrouwbaarheidsinterval voor het verschil tussen gemiddelden met een betrouwbaarheidsniveau van 1-α als volgt:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}

Goud:

  • \overline{x_i}

    is het gemiddelde van monster i.

  • s_i

    is de standaardafwijking van monster i.

  • t_{\alpha/2}

    is de waarde van de Student’s t-verdeling met een waarschijnlijkheid van α/2.

  • n_i

    is de steekproefomvang i.

In dit geval worden de vrijheidsgraden van de Student’s t-verdeling berekend met behulp van de volgende formule:

\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}

Goud

s_i

is de standaardafwijking van monster i.

Concreet voorbeeld van het betrouwbaarheidsinterval voor het verschil in gemiddelden

Nadat we de definitie van het betrouwbaarheidsinterval voor het verschil tussen gemiddelden hebben gezien en wat de verschillende formules zijn, zullen we nu een concreet voorbeeld zien om te voltooien hoe het betrouwbaarheidsinterval voor het verschil tussen twee gemiddelden wordt berekend.

  • Wij willen het effect van tabak op het geboortegewicht van kinderen onderzoeken. Om dit te doen worden twee steekproeven vergeleken: de eerste steekproef bestaat uit kinderen van wie de moeders niet rookten en de tweede steekproef bestaat uit kinderen van wie de moeders rookten (de steekproefparameters worden hieronder aangegeven). Bereken het betrouwbaarheidsinterval voor het verschil in gemiddelden met een betrouwbaarheidsniveau van 95%.
    1. Niet-rokende moeders:

      \overline{x_1}=3,1 \ kg \quad s_1=0,6 \ kg \quad n_1=39

    2. Rokende moeders:

      \overline{x_2}=3,5 \ kg \quad s_2=0,4 \ kg\quad n_2=43

In dit geval kennen we de waarden van de populatievarianties niet, maar we kunnen ervan uitgaan dat de populatievarianties gelijkwaardig zijn, omdat we te maken hebben met twee populaties met zeer vergelijkbare kenmerken. Daarom is de formule voor het betrouwbaarheidsinterval voor het verschil in middelen die we moeten gebruiken:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

We berekenen dus de gecombineerde standaardafwijking van de standaardafwijkingen van de twee steekproeven:

\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(39-1)\cdot 0,6^2+(43-1)\cdot 0,4^2}{39+43-2}}\\[2ex]\displaystyle s_p&=0,50\end{aligned}

Op dezelfde manier moeten we de waarde van de Student’s t-verdeling van 80 vrijheidsgraden met een waarschijnlijkheid van 2,5% vinden in de waarschijnlijkheidsverdelingstabel van de Student’s t-verdeling :

1-\alpha=0,95 \ \color{orange}\bm{\longrightarrow}\color{black} \ \alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}t_{\alpha/2| n_1+n_2-2}= \ \color{orange}\bm{?}\\[4ex]t_{0,025|80}=1,990\end{array}

Ten slotte vervangen we de gegevens in de betrouwbaarheidsintervalformule voor het verschil in gemiddelden en voeren we de berekeningen uit:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

\displaystyle (3,1-3,5)\pm 1,990\cdot 0,5\cdot\sqrt{\frac{1}{39}+\frac{1}{43}}

\displaystyle -0,4\pm 0,22

Het betrouwbaarheidsinterval voor het verschil in gemiddelden van het probleem is daarom als volgt:

(-0,61,-0,18)

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert