Konfidenzintervall für die differenz der mittelwerte

Von Dr. Benjamin Anderson August 3, 2023 Statistiken Keine Kommentare

In diesem Artikel wird erläutert, was ein Konfidenzintervall für die Mittelwertdifferenz in der Statistik ist und wofür es verwendet wird. So erfahren Sie Schritt für Schritt, wie Sie das Konfidenzintervall für die Differenz zweier Mittelwerte berechnen und eine Übung lösen.

Was ist das Konfidenzintervall für die Differenz der Mittelwerte?

Das Konfidenzintervall für die Mittelwertdifferenz ist ein Intervall, das einen Maximalwert und einen Minimalwert angibt, zwischen denen der Wert der Mittelwertdifferenz zweier Grundgesamtheiten mit einem bestimmten Konfidenzniveau liegt.

Wenn beispielsweise das Konfidenzintervall für die Differenz der Mittelwerte zweier Grundgesamtheiten mit einem Konfidenzniveau von 95 % (3,5) beträgt, bedeutet dies, dass die Differenz zwischen den Mittelwerten der beiden Grundgesamtheiten mit einer Wahrscheinlichkeit von 95 zwischen 3 und 5 liegt %.

Daher wird in der Statistik das Konfidenzintervall für die Mittelwertdifferenz verwendet, um zwei Werte zu schätzen, zwischen denen die Differenz zweier Grundgesamtheitsmittelwerte liegt. Mithilfe von Daten aus zwei Stichproben ist es somit möglich, die Differenz zwischen den Grundgesamtheitsmittelwerten anzunähern.

Konfidenzintervallformel für Mittelwertunterschiede

Die Formel für das Konfidenzintervall für die Mittelwertdifferenz hängt davon ab, ob die Populationsvarianzen bekannt sind oder nicht und, falls nicht, ob die Populationsvarianzen als gleich angenommen werden können oder nicht. . Wir werden dann sehen, wie das Konfidenzintervall für die Mittelwertdifferenz jeweils berechnet wird.

bekannte Abweichungen

Die Formel zur Berechnung des Konfidenzintervalls für die Mittelwertdifferenz, wenn die Varianzen der beiden Grundgesamtheiten mit einem Konfidenzniveau von 1-α bekannt sind, lautet wie folgt:

$\displaystyle (\overline{x_1}-\overline{x_2})\pm Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}$

Gold:

$\overline{x_i}$

ist der Mittelwert der Stichprobe i.
$\sigma_i$

ist die Standardabweichung der Grundgesamtheit i.
$Z_{\alpha/2}$

ist der Wert der Standardnormalverteilung mit der Wahrscheinlichkeit α/2.
$n_i$

ist die Stichprobengröße i.

Dieser Fall kommt am seltensten vor, da der Wert der Populationsvarianzen im Allgemeinen unbekannt ist.

unbekannte und gleiche Varianzen

Wenn die Varianzen der beiden Populationen unbekannt sind, aber als gleich eingeschätzt werden können, lautet die Formel zur Berechnung des Konfidenzintervalls für die Mittelwertdifferenz mit einem Konfidenzniveau von 1-α wie folgt:

$\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$

Gold:

$\overline{x_i}$

ist der Mittelwert der Stichprobe i.
$s_p$

ist die gepoolte Standardabweichung.
$t_{\alpha/2}$

ist der Wert der Student-t-Verteilung von n ₁ + n ₂ -2 Freiheitsgraden mit einer Wahrscheinlichkeit von α/2.
$n_i$

ist die Stichprobengröße i.

Da in diesem Fall davon ausgegangen wird, dass die Populationsvarianzen äquivalent sind, wird die kombinierte Standardabweichung zur Berechnung des Konfidenzintervalls verwendet, das mit der folgenden Formel berechnet wird:

$\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}$

Gold

$s_i$

ist die Standardabweichung der Probe i.

Unbekannte und unterschiedliche Variationen

Wenn die Varianzen der beiden Grundgesamtheiten unbekannt sind und nicht als gleich angenommen werden können, lautet die Formel zur Berechnung des Konfidenzintervalls für die Mittelwertdifferenz mit einem Konfidenzniveau von 1-α wie folgt:

$\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}$

Gold:

$\overline{x_i}$

ist der Mittelwert der Stichprobe i.
$s_i$

ist die Standardabweichung der Probe i.
$t_{\alpha/2}$

ist der Wert der Student-t-Verteilung mit einer Wahrscheinlichkeit von α/2.
$n_i$

ist die Stichprobengröße i.

In diesem Fall werden die Freiheitsgrade der Student-t-Verteilung anhand der folgenden Formel berechnet:

$\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}$

Gold

$s_i$

ist die Standardabweichung der Probe i.

➤ Siehe: Konfidenzintervallformel für den Mittelwert

Konkretes Beispiel für das Konfidenzintervall für die Mittelwertdifferenz

Nachdem wir die Definition des Konfidenzintervalls für die Differenz der Mittelwerte und die verschiedenen Formeln kennengelernt haben, sehen wir uns nun ein konkretes Beispiel an, um zu verstehen, wie das Konfidenzintervall für die Differenz zweier Mittelwerte berechnet wird.

Wir wollen den Einfluss von Tabak auf das Geburtsgewicht von Kindern untersuchen. Dazu werden zwei Stichproben verglichen: Die erste Stichprobe besteht aus Kindern, deren Mütter nicht geraucht haben, und die zweite Stichprobe besteht aus Kindern, deren Mütter geraucht haben (die Stichprobenparameter sind unten angegeben). Berechnen Sie das Konfidenzintervall für die Mittelwertdifferenz mit einem Konfidenzniveau von 95 %.
1. Nichtrauchermütter:
  $\overline{x_1}=3,1 \ kg \quad s_1=0,6 \ kg \quad n_1=39$
2. Rauchende Mütter:
  $\overline{x_2}=3,5 \ kg \quad s_2=0,4 \ kg\quad n_2=43$

In diesem Fall kennen wir die Werte der Populationsvarianzen nicht, können jedoch davon ausgehen, dass die Populationsvarianzen äquivalent sind, da es sich um zwei Populationen mit sehr ähnlichen Merkmalen handelt. Daher lautet die Formel für das Konfidenzintervall für die Mittelwertdifferenz, die wir verwenden sollten:

$\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$

Daher berechnen wir die kombinierte Standardabweichung aus den Standardabweichungen der beiden Stichproben:

$\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(39-1)\cdot 0,6^2+(43-1)\cdot 0,4^2}{39+43-2}}\\[2ex]\displaystyle s_p&=0,50\end{aligned}$

Ebenso müssen wir den Wert der Student-t-Verteilung mit 80 Freiheitsgraden mit einer Wahrscheinlichkeit von 2,5 % in der Wahrscheinlichkeitsverteilungstabelle der Student-t-Verteilung finden:

$1-\alpha=0,95 \ \color{orange}\bm{\longrightarrow}\color{black} \ \alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025$

$\begin{array}{c}t_{\alpha/2| n_1+n_2-2}= \ \color{orange}\bm{?}\\[4ex]t_{0,025|80}=1,990\end{array}$

Abschließend setzen wir die Daten in die Konfidenzintervallformel für die Mittelwertdifferenz ein und führen die Berechnungen durch:

$\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$

$\displaystyle (3,1-3,5)\pm 1,990\cdot 0,5\cdot\sqrt{\frac{1}{39}+\frac{1}{43}}$

$\displaystyle -0,4\pm 0,22$

Das Konfidenzintervall für die Differenz der Mittelwerte des Problems ist daher wie folgt:

$(-0,61,-0,18)$

➤ Siehe: Gegenüberstellung der Hypothesen zum Mittelwertunterschied

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen

Was ist das Konfidenzintervall für die Differenz der Mittelwerte?

Konfidenzintervallformel für Mittelwertunterschiede

bekannte Abweichungen

unbekannte und gleiche Varianzen

Unbekannte und unterschiedliche Variationen

Konkretes Beispiel für das Konfidenzintervall für die Mittelwertdifferenz

Über den Autor

Dr. Benjamin Anderson

Einen Kommentar hinzufügen