Konfidenzniveau und konfidenzintervall: was ist der unterschied?
In der Statistik versuchen wir oft, Bevölkerungsparameter zu messen – Zahlen, die bestimmte Merkmale einer gesamten Bevölkerung beschreiben.
Beispielsweise könnten wir daran interessiert sein, die durchschnittliche Körpergröße von Männern in einem bestimmten Land zu messen.
Da es zu teuer und zeitaufwändig ist, Daten über die Körpergröße jedes Mannes im Land zu sammeln, würden wir stattdessen Daten über eine einfache Zufallsstichprobe von Männern sammeln. Anschließend würden wir die durchschnittliche Größe der Männer in dieser Stichprobe verwenden, um die durchschnittliche Größe aller Männer im Land zu schätzen.
Leider kann nicht garantiert werden, dass die durchschnittliche Größe der Männer in der Stichprobe genau mit der durchschnittlichen Größe der Männer in der gesamten Bevölkerung übereinstimmt. Beispielsweise können wir eine Stichprobe kleinerer Männer oder vielleicht eine Stichprobe größerer Männer auswählen.
Um unsere Unsicherheit bezüglich unserer Schätzung des wahren Bevölkerungsmittelwerts zu erfassen, können wir ein Konfidenzintervall erstellen.
Konfidenzintervall: Wertebereich, der wahrscheinlich einen Populationsparameter mit einem bestimmten Konfidenzniveau enthält.
Ein Konfidenzintervall wird nach der folgenden allgemeinen Formel berechnet:
Konfidenzintervall = (Punktschätzung) +/- (kritischer Wert)* (Standardfehler)
Die Formel zur Berechnung eines Konfidenzintervalls für einen Grundgesamtheitsmittelwert lautet beispielsweise:
Konfidenzintervall = x +/- z*(s/√ n )
Gold:
- x : Stichprobenmittel
- z: der kritische Wert von z
- s: Stichprobenstandardabweichung
- n: Stichprobengröße
Der kritische Z-Wert, den Sie in der Formel verwenden, hängt vom gewählten Konfidenzniveau ab.
Konfidenzniveau: Prozentsatz aller möglichen Stichproben, von denen erwartet wird, dass sie den wahren Populationsparameter enthalten.
Die häufigsten Konfidenzniveaus sind 90 %, 95 % und 99 %.
Die folgende Tabelle zeigt den kritischen Z-Wert, der diesen beliebten Konfidenzniveauoptionen entspricht:
Ein Maß an Selbstvertrauen | z kritischer Wert |
---|---|
0,90 | 1.645 |
0,95 | 1,96 |
0,99 | 2,58 |
Angenommen, wir haben die Größe von 25 Männern gemessen und Folgendes festgestellt:
- Stichprobengröße n = 25
- Durchschnittliche Probenhöhe x = 70 Zoll
- Probenstandardabweichung s = 1,2 Zoll
So berechnen Sie ein Konfidenzintervall für die tatsächliche durchschnittliche Bevölkerungsgröße unter Verwendung eines Konfidenzniveaus von 90 % :
90 %-Konfidenzintervall: 70 +/- 1,645*(1,2/√25) = [69,6052, 70,3948]
Das heißt, wenn wir dieselbe Stichprobenmethode zur Auswahl verschiedener Stichproben verwenden und für jede Stichprobe ein Konfidenzintervall berechnen würden, würden wir erwarten, dass die tatsächliche durchschnittliche Populationsgröße in 90 % der Fälle innerhalb des Intervalls liegt.
Angenommen, wir berechnen stattdessen ein Konfidenzintervall mit einem Konfidenzniveau von 95 %:
95 %-Konfidenzintervall: 70 +/- 1,96*(1,2/√25) = [69,5296, 70,4704]
Beachten Sie, dass dieses Konfidenzintervall breiter ist als das vorherige. Tatsächlich ist das Konfidenzintervall umso größer, je höher das Konfidenzniveau ist.
Je höher das Konfidenzniveau, desto breiter das Konfidenzintervall.
Dies sollte intuitiv Sinn machen: Ein breiteres Konfidenzniveau hat eine höhere Wahrscheinlichkeit, einen echten Populationsparameter zu enthalten.
Zusammenfassung
In Summe:
Ein Konfidenzintervall ist ein Wertebereich, der wahrscheinlich einen Populationsparameter mit einem bestimmten Konfidenzniveau enthält. Es verwendet die folgende Grundformel:
Konfidenzintervall = (Punktschätzung) +/- (kritischer Wert)* (Standardfehler)
Das Konfidenzniveau bestimmt den kritischen Wert, der in dieser Formel verwendet werden soll. Je höher das Konfidenzniveau, desto größer der kritische Wert und desto breiter das Konfidenzintervall.
Zusätzliche Ressourcen
Einführung in Konfidenzintervalle
Einführung in das Testen von Hypothesen
Was ist eine Punktschätzung?