Konfidenzintervall für die differenz der mittelwerte

In diesem Artikel wird erläutert, was ein Konfidenzintervall für die Mittelwertdifferenz in der Statistik ist und wofür es verwendet wird. So erfahren Sie Schritt für Schritt, wie Sie das Konfidenzintervall für die Differenz zweier Mittelwerte berechnen und eine Übung lösen.

Was ist das Konfidenzintervall für die Differenz der Mittelwerte?

Das Konfidenzintervall für die Mittelwertdifferenz ist ein Intervall, das einen Maximalwert und einen Minimalwert angibt, zwischen denen der Wert der Mittelwertdifferenz zweier Grundgesamtheiten mit einem bestimmten Konfidenzniveau liegt.

Wenn beispielsweise das Konfidenzintervall für die Differenz der Mittelwerte zweier Grundgesamtheiten mit einem Konfidenzniveau von 95 % (3,5) beträgt, bedeutet dies, dass die Differenz zwischen den Mittelwerten der beiden Grundgesamtheiten mit einer Wahrscheinlichkeit von 95 zwischen 3 und 5 liegt %.

Daher wird in der Statistik das Konfidenzintervall für die Mittelwertdifferenz verwendet, um zwei Werte zu schätzen, zwischen denen die Differenz zweier Grundgesamtheitsmittelwerte liegt. Mithilfe von Daten aus zwei Stichproben ist es somit möglich, die Differenz zwischen den Grundgesamtheitsmittelwerten anzunähern.

Konfidenzintervallformel für Mittelwertunterschiede

Die Formel für das Konfidenzintervall für die Mittelwertdifferenz hängt davon ab, ob die Populationsvarianzen bekannt sind oder nicht und, falls nicht, ob die Populationsvarianzen als gleich angenommen werden können oder nicht. . Wir werden dann sehen, wie das Konfidenzintervall für die Mittelwertdifferenz jeweils berechnet wird.

bekannte Abweichungen

Die Formel zur Berechnung des Konfidenzintervalls für die Mittelwertdifferenz, wenn die Varianzen der beiden Grundgesamtheiten mit einem Konfidenzniveau von 1-α bekannt sind, lautet wie folgt:

\displaystyle (\overline{x_1}-\overline{x_2})\pm Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}

Gold:

  • \overline{x_i}

    ist der Mittelwert der Stichprobe i.

  • \sigma_i

    ist die Standardabweichung der Grundgesamtheit i.

  • Z_{\alpha/2}

    ist der Wert der Standardnormalverteilung mit der Wahrscheinlichkeit α/2.

  • n_i

    ist die Stichprobengröße i.

Dieser Fall kommt am seltensten vor, da der Wert der Populationsvarianzen im Allgemeinen unbekannt ist.

unbekannte und gleiche Varianzen

Wenn die Varianzen der beiden Populationen unbekannt sind, aber als gleich eingeschätzt werden können, lautet die Formel zur Berechnung des Konfidenzintervalls für die Mittelwertdifferenz mit einem Konfidenzniveau von 1-α wie folgt:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

Gold:

  • \overline{x_i}

    ist der Mittelwert der Stichprobe i.

  • s_p

    ist die gepoolte Standardabweichung.

  • t_{\alpha/2}

    ist der Wert der Student-t-Verteilung von n 1 + n 2 -2 Freiheitsgraden mit einer Wahrscheinlichkeit von α/2.

  • n_i

    ist die Stichprobengröße i.

Da in diesem Fall davon ausgegangen wird, dass die Populationsvarianzen äquivalent sind, wird die kombinierte Standardabweichung zur Berechnung des Konfidenzintervalls verwendet, das mit der folgenden Formel berechnet wird:

\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}

Gold

s_i

ist die Standardabweichung der Probe i.

Unbekannte und unterschiedliche Variationen

Wenn die Varianzen der beiden Grundgesamtheiten unbekannt sind und nicht als gleich angenommen werden können, lautet die Formel zur Berechnung des Konfidenzintervalls für die Mittelwertdifferenz mit einem Konfidenzniveau von 1-α wie folgt:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}

Gold:

  • \overline{x_i}

    ist der Mittelwert der Stichprobe i.

  • s_i

    ist die Standardabweichung der Probe i.

  • t_{\alpha/2}

    ist der Wert der Student-t-Verteilung mit einer Wahrscheinlichkeit von α/2.

  • n_i

    ist die Stichprobengröße i.

In diesem Fall werden die Freiheitsgrade der Student-t-Verteilung anhand der folgenden Formel berechnet:

\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}

Gold

s_i

ist die Standardabweichung der Probe i.

Konkretes Beispiel für das Konfidenzintervall für die Mittelwertdifferenz

Nachdem wir die Definition des Konfidenzintervalls für die Differenz der Mittelwerte und die verschiedenen Formeln kennengelernt haben, sehen wir uns nun ein konkretes Beispiel an, um zu verstehen, wie das Konfidenzintervall für die Differenz zweier Mittelwerte berechnet wird.

  • Wir wollen den Einfluss von Tabak auf das Geburtsgewicht von Kindern untersuchen. Dazu werden zwei Stichproben verglichen: Die erste Stichprobe besteht aus Kindern, deren Mütter nicht geraucht haben, und die zweite Stichprobe besteht aus Kindern, deren Mütter geraucht haben (die Stichprobenparameter sind unten angegeben). Berechnen Sie das Konfidenzintervall für die Mittelwertdifferenz mit einem Konfidenzniveau von 95 %.
    1. Nichtrauchermütter:

      \overline{x_1}=3,1 \ kg \quad s_1=0,6 \ kg \quad n_1=39

    2. Rauchende Mütter:

      \overline{x_2}=3,5 \ kg \quad s_2=0,4 \ kg\quad n_2=43

In diesem Fall kennen wir die Werte der Populationsvarianzen nicht, können jedoch davon ausgehen, dass die Populationsvarianzen äquivalent sind, da es sich um zwei Populationen mit sehr ähnlichen Merkmalen handelt. Daher lautet die Formel für das Konfidenzintervall für die Mittelwertdifferenz, die wir verwenden sollten:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

Daher berechnen wir die kombinierte Standardabweichung aus den Standardabweichungen der beiden Stichproben:

\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(39-1)\cdot 0,6^2+(43-1)\cdot 0,4^2}{39+43-2}}\\[2ex]\displaystyle s_p&=0,50\end{aligned}

Ebenso müssen wir den Wert der Student-t-Verteilung mit 80 Freiheitsgraden mit einer Wahrscheinlichkeit von 2,5 % in der Wahrscheinlichkeitsverteilungstabelle der Student-t-Verteilung finden:

1-\alpha=0,95 \ \color{orange}\bm{\longrightarrow}\color{black} \ \alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}t_{\alpha/2| n_1+n_2-2}= \ \color{orange}\bm{?}\\[4ex]t_{0,025|80}=1,990\end{array}

Abschließend setzen wir die Daten in die Konfidenzintervallformel für die Mittelwertdifferenz ein und führen die Berechnungen durch:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

\displaystyle (3,1-3,5)\pm 1,990\cdot 0,5\cdot\sqrt{\frac{1}{39}+\frac{1}{43}}

\displaystyle -0,4\pm 0,22

Das Konfidenzintervall für die Differenz der Mittelwerte des Problems ist daher wie folgt:

(-0,61,-0,18)

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert