Die beziehung zwischen stichprobengröße und fehlerquote
In der Statistik möchten wir häufig den Wert eines Bevölkerungsparameters schätzen, beispielsweise einen Bevölkerungsanteil oder einen Bevölkerungsmittelwert .
Um diese Werte zu schätzen, ziehen wir in der Regel eine einfache Zufallsstichprobe und berechnen den Stichprobenanteil bzw. Stichprobenmittelwert.
Anschließend erstellen wir ein Konfidenzintervall , um unsere Unsicherheit im Zusammenhang mit diesen Schätzungen zu erfassen.
Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Bevölkerungsanteil zu berechnen:
Konfidenzintervall = p ± z*√ p(1-p) / n
Gold:
- p: Stichprobenanteil
- z: der gewählte z-Wert
- n: Stichprobengröße
Und wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Grundgesamtheitsmittelwert zu berechnen:
Konfidenzintervall = x̄ ± z*(s/√ n )
Gold:
- x̄: Stichprobenmittelwert
- z: der gewählte z-Wert
- s : Stichprobenstandardabweichung
- n: Stichprobengröße
In beiden Formeln besteht eine umgekehrte Beziehung zwischen Stichprobengröße und Fehlermarge.
Je größer die Stichprobe, desto geringer ist die Fehlerquote. Umgekehrt ist die Fehlerquote umso größer, je kleiner die Stichprobengröße ist.
Schauen Sie sich die folgenden zwei Beispiele an, um dies besser zu verstehen.
Beispiel 1: Stichprobengröße und Fehlermarge für einen Bevölkerungsanteil
Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Bevölkerungsanteil zu berechnen:
Konfidenzintervall = p ± z*√ p(1-p) / n
Der rote Teil wird Fehlerspanne genannt:
Konfidenzintervall = p ± z*√ p(1-p) / n
Beachten Sie, dass wir innerhalb der Fehlertoleranz durch n (die Stichprobengröße) dividieren.
Wenn also die Stichprobengröße groß ist, dividieren wir durch eine große Zahl, was die Gesamtfehlerquote verringert. Dies führt zu einem engeren Konfidenzintervall.
Angenommen, wir sammeln eine einfache Zufallsstichprobe von Daten mit den folgenden Informationen:
- p: 0,6
- n: 25
So berechnen Sie ein 95 %-Konfidenzintervall für den Bevölkerungsanteil:
- Konfidenzintervall = p ± z*√ p(1-p) / n
- Konfidenzintervall = 0,6 ± 1,96*√ 0,6(1-0,6) / 25
- Konfidenzintervall = 0,6 ± 0,192
- Konfidenzintervall = [.408, .792]
Überlegen Sie nun, ob wir stattdessen eine Stichprobengröße von 200 verwenden würden. So würden wir das 95 %-Konfidenzintervall für den Bevölkerungsanteil berechnen:
- Konfidenzintervall = p ± z*√ p(1-p) / n
- Konfidenzintervall = 0,6 ± 1,96*√ 0,6(1-0,6) / 200
- Konfidenzintervall = 0,6 ± 0,068
- Konfidenzintervall = [.532, .668]
Beachten Sie, dass wir durch einfaches Erhöhen der Stichprobengröße die Fehlerquote verringern und ein viel engeres Konfidenzintervall erzielen konnten.
Beispiel 2: Stichprobengröße und Fehlerspanne für einen Bevölkerungsdurchschnitt
Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Grundgesamtheitsmittelwert zu berechnen:
Konfidenzintervall = x̄ ± z*(s/√ n )
Der rote Teil wird Fehlerspanne genannt:
Konfidenzintervall = x̄ ± z*(s/√ n )
Beachten Sie, dass wir innerhalb der Fehlertoleranz durch n (die Stichprobengröße) dividieren.
Wenn also die Stichprobengröße groß ist, dividieren wir durch eine große Zahl, was die Gesamtfehlerquote verringert. Dies führt zu einem engeren Konfidenzintervall.
Angenommen, wir sammeln eine einfache Zufallsstichprobe von Daten mit den folgenden Informationen:
- x̄: 15
- s : 4
- n: 25
So berechnen Sie ein 95 %-Konfidenzintervall für den Grundgesamtheitsmittelwert:
- Konfidenzintervall = x̄ ± z*(s/√ n )
- Konfidenzintervall = 15 ± 1,96*(4/√ 25 )
- Konfidenzintervall = 15 ± 1,568
- Konfidenzintervall = [13,432, 16,568]
Überlegen Sie nun, ob wir stattdessen eine Stichprobengröße von 200 verwenden würden. So würden wir das 95 %-Konfidenzintervall für den Grundgesamtheitsmittelwert berechnen:
- Konfidenzintervall = x̄ ± z*(s/√ n )
- Konfidenzintervall = 15 ± 1,96*(4/√ 200 )
- Konfidenzintervall = 15 ± 0,554
- Konfidenzintervall = [14,446, 15,554]
Beachten Sie, dass wir durch einfaches Erhöhen der Stichprobengröße die Fehlerquote verringern und ein engeres Konfidenzintervall erzielen konnten.
Zusätzliche Ressourcen
Die folgenden Tutorials bieten zusätzliche Informationen zu Konfidenzintervallen für einen Anteil:
Die folgenden Tutorials bieten zusätzliche Informationen zu Konfidenzintervallen für einen Mittelwert: