Konfidenzintervall für die differenz zwischen den mittelwerten
Ein Konfidenzintervall (CI) für eine Differenz zwischen Mittelwerten ist ein Wertebereich, der mit einem bestimmten Konfidenzniveau wahrscheinlich die wahre Differenz zwischen zwei Populationsmittelwerten enthält.
In diesem Tutorial wird Folgendes erklärt:
- Die Motivation, dieses Konfidenzintervall zu erstellen.
- Die Formel zum Erstellen dieses Konfidenzintervalls.
- Ein Beispiel für die Berechnung dieses Konfidenzintervalls.
- Wie ist dieses Konfidenzintervall zu interpretieren?
CI für den Mittelwertunterschied: Motivation
Forscher möchten häufig die Differenz zwischen den Mittelwerten zweier Populationen schätzen. Um diesen Unterschied abzuschätzen, sammeln sie eine Zufallsstichprobe aus jeder Population und berechnen den Mittelwert für jede Stichprobe. Dann können sie die Differenz zwischen den beiden Durchschnittswerten vergleichen.
Sie können jedoch nicht sicher wissen, ob die Differenz zwischen den Stichprobenmittelwerten der wahren Differenz zwischen den Grundgesamtheitsmittelwerten entspricht. Aus diesem Grund können sie ein Konfidenzintervall für die Differenz zwischen den beiden Mittelwerten erstellen. Dies liefert einen Wertebereich, der wahrscheinlich die wahre Differenz zwischen den Mittelwerten der Grundgesamtheit enthält.
Angenommen, wir möchten den Unterschied im Durchschnittsgewicht zwischen zwei verschiedenen Schildkrötenarten abschätzen. Da es in jeder Population Tausende von Schildkröten gibt, wäre es zu zeitaufwändig und teuer, jede Schildkröte einzeln zu wiegen.
Stattdessen könnten wir eine einfache Zufallsstichprobe von 15 Schildkröten aus jeder Population ziehen und das Durchschnittsgewicht jeder Stichprobe verwenden, um den wahren Unterschied im Durchschnittsgewicht zwischen den beiden Populationen abzuschätzen:
Das Problem besteht darin, dass unsere Stichproben zufällig sind, sodass nicht garantiert werden kann, dass der Unterschied im Durchschnittsgewicht zwischen den beiden Stichproben genau mit dem Unterschied im Durchschnittsgewicht zwischen den beiden Populationen übereinstimmt. Um diese Unsicherheit zu erfassen, können wir ein Konfidenzintervall erstellen, das einen Wertebereich enthält, der wahrscheinlich den wahren Unterschied im Mittelgewicht zwischen den beiden Populationen enthält.
CI für die Differenz zwischen Mittelwerten: Formel
Wir verwenden die folgende Formel, um ein Konfidenzintervall für eine Differenz zwischen zwei Mittelwerten zu berechnen:
Konfidenzintervall = ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
Gold:
- x 1 , x 2 : Mittelwert von Stichprobe 1, Mittelwert von Stichprobe 2
- t: der t-kritische Wert basierend auf dem Konfidenzniveau und den Freiheitsgraden (n 1 + n 2 -2).
- s p 2 : gepoolte Varianz
- n 1 , n 2 : Stichprobengröße 1, Stichprobengröße 2
Gold:
- Die gepoolte Varianz wird wie folgt berechnet: s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- Der t-kritische Wert t kann mit dem inversen t-Verteilungsrechner ermittelt werden.
CI für die Differenz zwischen Mittelwerten: Beispiel
Angenommen, wir möchten den Unterschied im Durchschnittsgewicht zwischen zwei verschiedenen Schildkrötenarten abschätzen. Wir werden daher eine Zufallsstichprobe von 15 Schildkröten aus jeder Population sammeln. Hier sind die zusammenfassenden Daten für jede Probe:
Probe 1:
- x1 = 310
- s 1 = 18,5
- n 1 = 15
Probe 2:
- x2 = 300
- s2 = 16,4
- n2 = 15
So finden Sie unterschiedliche Konfidenzintervalle für den wahren Unterschied in den Durchschnittsgewichten der Bevölkerung:
90 %-Konfidenzintervall:
(310-300) +/- 1,70*√((305,61/15) + (305,61/15)) = [-0,8589, 20,8589]
95 %-Konfidenzintervall:
(310-300) +/- 2,05*√((305,61/15) + (305,61/15)) = [-3,0757, 23,0757]
99 %-Konfidenzintervall:
(310-300) +/- 2,76*√((305,61/15) + (305,61/15)) = [-7,6389, 27,6389]
Hinweis: Sie können diese Konfidenzintervalle auch mit dem Rechner für statistische Konfidenzintervalle für Differenzen zwischen Mittelwerten ermitteln.
Sie werden feststellen, dass das Konfidenzintervall umso größer ist, je höher das Konfidenzniveau ist. Dies sollte sinnvoll sein, da größere Intervalle mit größerer Wahrscheinlichkeit den wahren Mittelwert der Grundgesamtheit enthalten, sodass wir „zuversichtlicher“ sind, dass das Intervall den wahren Mittelwert der Grundgesamtheit enthält.
CI für die Differenz zwischen Mittelwerten : Interpretation
Die Art und Weise, wie wir ein Konfidenzintervall interpretieren würden, ist:
Es besteht eine Wahrscheinlichkeit von 95 %, dass das Konfidenzintervall von [-3,0757, 23,0757] den wahren Unterschied im Durchschnittsgewicht zwischen den beiden Schildkrötenpopulationen enthält.
Da dieses Intervall den Wert „0“ enthält, bedeutet dies, dass es möglicherweise keinen Unterschied im Durchschnittsgewicht zwischen den Schildkröten dieser beiden Populationen gibt. Mit anderen Worten: Wir können nicht mit 95-prozentiger Sicherheit sagen, dass es einen Unterschied im Durchschnittsgewicht zwischen den Schildkröten dieser beiden Populationen gibt.