Konfidenzintervall für die differenz zwischen den mittelwerten

Von Dr. Benjamin Anderson Juli 28, 2023 Führung Keine Kommentare

Ein Konfidenzintervall (CI) für eine Differenz zwischen Mittelwerten ist ein Wertebereich, der mit einem bestimmten Konfidenzniveau wahrscheinlich die wahre Differenz zwischen zwei Populationsmittelwerten enthält.

In diesem Tutorial wird Folgendes erklärt:

Die Motivation, dieses Konfidenzintervall zu erstellen.
Die Formel zum Erstellen dieses Konfidenzintervalls.
Ein Beispiel für die Berechnung dieses Konfidenzintervalls.
Wie ist dieses Konfidenzintervall zu interpretieren?

CI für den Mittelwertunterschied: Motivation

Forscher möchten häufig die Differenz zwischen den Mittelwerten zweier Populationen schätzen. Um diesen Unterschied abzuschätzen, sammeln sie eine Zufallsstichprobe aus jeder Population und berechnen den Mittelwert für jede Stichprobe. Dann können sie die Differenz zwischen den beiden Durchschnittswerten vergleichen.

Sie können jedoch nicht sicher wissen, ob die Differenz zwischen den Stichprobenmittelwerten der wahren Differenz zwischen den Grundgesamtheitsmittelwerten entspricht. Aus diesem Grund können sie ein Konfidenzintervall für die Differenz zwischen den beiden Mittelwerten erstellen. Dies liefert einen Wertebereich, der wahrscheinlich die wahre Differenz zwischen den Mittelwerten der Grundgesamtheit enthält.

Angenommen, wir möchten den Unterschied im Durchschnittsgewicht zwischen zwei verschiedenen Schildkrötenarten abschätzen. Da es in jeder Population Tausende von Schildkröten gibt, wäre es zu zeitaufwändig und teuer, jede Schildkröte einzeln zu wiegen.

Stattdessen könnten wir eine einfache Zufallsstichprobe von 15 Schildkröten aus jeder Population ziehen und das Durchschnittsgewicht jeder Stichprobe verwenden, um den wahren Unterschied im Durchschnittsgewicht zwischen den beiden Populationen abzuschätzen:

Konfidenzintervall für eine Differenz zwischen zwei Grundgesamtheitsmittelwerten

Das Problem besteht darin, dass unsere Stichproben zufällig sind, sodass nicht garantiert werden kann, dass der Unterschied im Durchschnittsgewicht zwischen den beiden Stichproben genau mit dem Unterschied im Durchschnittsgewicht zwischen den beiden Populationen übereinstimmt. Um diese Unsicherheit zu erfassen, können wir ein Konfidenzintervall erstellen, das einen Wertebereich enthält, der wahrscheinlich den wahren Unterschied im Mittelgewicht zwischen den beiden Populationen enthält.

CI für die Differenz zwischen Mittelwerten: Formel

Wir verwenden die folgende Formel, um ein Konfidenzintervall für eine Differenz zwischen zwei Mittelwerten zu berechnen:

Konfidenzintervall = ( x ₁ – x ₂ ) +/- t*√((s _p ² /n ₁ ) + (s _p ² /n ₂ ))

Gold:

x ₁ , x ₂ : Mittelwert von Stichprobe 1, Mittelwert von Stichprobe 2
t: der t-kritische Wert basierend auf dem Konfidenzniveau und den Freiheitsgraden (n ₁ + n ₂ -2).
s _p ² : gepoolte Varianz
n ₁ , n ₂ : Stichprobengröße 1, Stichprobengröße 2

Gold:

Die gepoolte Varianz wird wie folgt berechnet: s _p ² = ((n ₁ -1)s ₁ ² + (n ₂ -1)s ₂ ² ) / (n ₁ +n ₂ -2)
Der t-kritische Wert t kann mit dem inversen t-Verteilungsrechner ermittelt werden.

CI für die Differenz zwischen Mittelwerten: Beispiel

Angenommen, wir möchten den Unterschied im Durchschnittsgewicht zwischen zwei verschiedenen Schildkrötenarten abschätzen. Wir werden daher eine Zufallsstichprobe von 15 Schildkröten aus jeder Population sammeln. Hier sind die zusammenfassenden Daten für jede Probe:

Probe 1:

x1 = ₃₁₀
s ₁ = 18,5
n ₁ = 15

Probe 2:

x2 ₌ 300
_s2 = 16,4
_n2 = 15

So finden Sie unterschiedliche Konfidenzintervalle für den wahren Unterschied in den Durchschnittsgewichten der Bevölkerung:

90 %-Konfidenzintervall:

(310-300) +/- 1,70*√((305,61/15) + (305,61/15)) = [-0,8589, 20,8589]

95 %-Konfidenzintervall:

(310-300) +/- 2,05*√((305,61/15) + (305,61/15)) = [-3,0757, 23,0757]

99 %-Konfidenzintervall:

(310-300) +/- 2,76*√((305,61/15) + (305,61/15)) = [-7,6389, 27,6389]

Hinweis: Sie können diese Konfidenzintervalle auch mit dem Rechner für statistische Konfidenzintervalle für Differenzen zwischen Mittelwerten ermitteln.

Sie werden feststellen, dass das Konfidenzintervall umso größer ist, je höher das Konfidenzniveau ist. Dies sollte sinnvoll sein, da größere Intervalle mit größerer Wahrscheinlichkeit den wahren Mittelwert der Grundgesamtheit enthalten, sodass wir „zuversichtlicher“ sind, dass das Intervall den wahren Mittelwert der Grundgesamtheit enthält.

CI für die Differenz zwischen Mittelwerten : Interpretation

Die Art und Weise, wie wir ein Konfidenzintervall interpretieren würden, ist:

Es besteht eine Wahrscheinlichkeit von 95 %, dass das Konfidenzintervall von [-3,0757, 23,0757] den wahren Unterschied im Durchschnittsgewicht zwischen den beiden Schildkrötenpopulationen enthält.

Da dieses Intervall den Wert „0“ enthält, bedeutet dies, dass es möglicherweise keinen Unterschied im Durchschnittsgewicht zwischen den Schildkröten dieser beiden Populationen gibt. Mit anderen Worten: Wir können nicht mit 95-prozentiger Sicherheit sagen, dass es einen Unterschied im Durchschnittsgewicht zwischen den Schildkröten dieser beiden Populationen gibt.

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen