Zentraler grenzwertsatz: definition + beispiele
Der zentrale Grenzwertsatz besagt, dass die Stichprobenverteilung eines Stichprobenmittelwerts annähernd normal ist, wenn die Stichprobengröße groß genug ist, auch wenn die Grundgesamtheitsverteilung nicht normal ist .
Der zentrale Grenzwertsatz besagt außerdem, dass die Stichprobenverteilung die folgenden Eigenschaften haben wird:
1. Der Mittelwert der Stichprobenverteilung entspricht dem Mittelwert der Bevölkerungsverteilung:
x = µ
2. Die Varianz der Stichprobenverteilung entspricht der Varianz der Bevölkerungsverteilung dividiert durch die Stichprobengröße:
s2 = σ2 /n
Beispiele für den zentralen Grenzwertsatz
Hier sind einige Beispiele, um den zentralen Grenzwertsatz in der Praxis zu veranschaulichen.
Gleichmäßige Verteilung
Angenommen, die Breite des Panzers einer Schildkröte folgt einer gleichmäßigen Verteilung mit einer minimalen Breite von 2 Zoll und einer maximalen Breite von 6 Zoll. Das heißt, wenn wir eine Schildkröte zufällig auswählen und die Breite ihres Panzers messen, ist es wahrscheinlich, dass sie auch zwischen 2 und 6 Zoll breit ist.
Wenn wir ein Histogramm erstellen würden, um die Verteilung der Schildkrötenpanzerbreiten darzustellen, würde es so aussehen:
Der Mittelwert einer Gleichverteilung ist μ = (b+a) / 2, wobei b der größtmögliche Wert und a der kleinstmögliche Wert ist. In diesem Fall ist es (6+2) / 2 = 4.
Die Varianz einer Gleichverteilung beträgt σ2 = (ba) 2/12 . In diesem Fall ist es (6-2) 2/12 = 1,33
Zufallsstichprobe von 2 aus der Gleichverteilung
Stellen Sie sich nun vor, wir nehmen eine zufällige Stichprobe von zwei Schildkröten aus dieser Population und messen die Breite des Panzers jeder Schildkröte. Nehmen wir an, dass der Panzer der ersten Schildkröte 3 Zoll und der zweite 6 Zoll breit ist. Die durchschnittliche Breite dieser Probe von 2 Schildkröten beträgt 4,5 Zoll.
Stellen Sie sich als nächstes vor, dass wir eine weitere Zufallsstichprobe von zwei Schildkröten aus dieser Population nehmen und die Panzerbreite jeder Schildkröte erneut messen. Nehmen wir an, dass der Panzer der ersten Schildkröte 2,5 Zoll breit ist und der Panzer der zweiten ebenfalls 2,5 Zoll breit ist. Die durchschnittliche Breite dieser Probe von 2 Schildkröten beträgt 2,5 Zoll.
Stellen Sie sich vor, wir nehmen immer wieder zufällige Proben von zwei Schildkröten und ermitteln jedes Mal die durchschnittliche Panzerbreite.
Wenn wir ein Histogramm erstellen würden, um die durchschnittliche Panzerbreite aller dieser Proben von zwei Schildkröten darzustellen, würde es so aussehen:
Dies wird als Stichprobenverteilung für die Stichprobenmittelwerte bezeichnet, da sie die Verteilung der Stichprobenmittelwerte zeigt.
Der Mittelwert dieser Stichprobenverteilung ist x = μ = 4
Die Varianz dieser Stichprobenverteilung beträgt s2 = σ2 / n = 1,33 / 2 = 0,665
Zufallsstichprobe von 5 aus der Gleichverteilung
Stellen Sie sich nun vor, wir wiederholen das gleiche Experiment, aber dieses Mal nehmen wir immer wieder zufällige Proben von 5 Schildkröten und ermitteln jedes Mal die durchschnittliche Panzerbreite.
Wenn wir ein Histogramm erstellen würden, um die durchschnittliche Panzerbreite aller dieser Proben von 5 Schildkröten darzustellen, würde es so aussehen:
Beachten Sie, dass diese Verteilung eher eine „Glockenform“ hat, dieder Normalverteilung ähnelt. Dies liegt daran, dass bei der Entnahme von Stichproben von 5 die Varianz zwischen unseren Stichprobenmittelwerten viel geringer ist, so dass es weniger wahrscheinlich ist, dass wir Stichproben mit einem Mittelwert von etwa 2 Zoll oder 6 Zoll erhalten, und dass die Wahrscheinlichkeit größer ist, dass wir Stichproben mit einem Mittelwert von etwa 2 Zoll oder 6 Zoll erhalten 6 Zoll. Der Durchschnitt liegt um 4 Zoll näher am tatsächlichen Bevölkerungsdurchschnitt.
Der Mittelwert dieser Stichprobenverteilung ist x = μ = 4
Die Varianz dieser Stichprobenverteilung beträgt s2 = σ2 / n = 1,33 / 5 = 0,266
Zufallsstichprobe von 30 aus der Gleichverteilung
Stellen Sie sich nun vor, wir wiederholen das gleiche Experiment, aber dieses Mal nehmen wir immer wieder zufällige Proben von 30 Schildkröten und ermitteln jedes Mal die durchschnittliche Panzerbreite.
Wenn wir ein Histogramm erstellen würden, um die durchschnittliche Panzerbreite aller dieser Proben von 30 Schildkröten darzustellen, würde es so aussehen:
Beachten Sie, dass diese Stichprobenverteilung noch glockenförmiger und viel enger ist als die beiden vorherigen Verteilungen.
Der Mittelwert dieser Stichprobenverteilung ist x = μ = 4
Die Varianz dieser Stichprobenverteilung beträgt s2 = σ2 / n = 1,33 / 30 = 0,044
Die Chi-Quadrat-Verteilung
Angenommen, die Anzahl der Haustiere pro Familie in einer bestimmten Stadt folgt einer Chi-Quadrat-Verteilung mit drei Freiheitsgraden. Wenn wir ein Histogramm erstellen würden, um die Verteilung der Tiere nach Familien darzustellen, würde es so aussehen:
Der Mittelwert einer Chi-Quadrat-Verteilung ist einfach die Anzahl der Freiheitsgrade (df). In diesem Fall ist μ = 3 .
Die Varianz einer Chi-Quadrat-Verteilung beträgt 2 * df. In diesem Fall ist σ2 = 2 * 3 = 6 .
Stichprobenentnahme von 2
Stellen Sie sich vor, wir nehmen eine Zufallsstichprobe von zwei Familien aus dieser Population und zählen die Anzahl der Haustiere in jeder Familie. Angenommen, die erste Familie hat 4 Haustiere und die zweite Familie hat 1 Haustier. Die durchschnittliche Anzahl der Haustiere für diese Stichprobe von 2 Familien beträgt 2,5.
Stellen Sie sich dann vor, wir nehmen eine weitere Zufallsstichprobe von zwei Familien aus dieser Population und zählen erneut die Anzahl der Haustiere in jeder Familie. Angenommen, die erste Familie hat 6 Haustiere und die zweite Familie hat 4 Haustiere. Die durchschnittliche Anzahl der Haustiere für diese Stichprobe von 2 Familien beträgt 5.
Stellen Sie sich vor, wir nehmen immer wieder Stichproben aus zwei Familien und ermitteln jedes Mal die durchschnittliche Anzahl an Haustieren.
Wenn wir ein Histogramm erstellen würden, um die durchschnittliche Anzahl der Haustiere aller dieser Stichproben aus zwei Familien darzustellen, würde es so aussehen:
Der Mittelwert dieser Stichprobenverteilung ist x = μ = 3
Die Varianz dieser Stichprobenverteilung beträgt s 2 = σ 2 / n = 6 / 2 = 3
Stichprobenziehung von 10 Personen
Stellen Sie sich nun vor, wir wiederholen das gleiche Experiment, aber dieses Mal nehmen wir immer wieder zufällige Stichproben von 10 Familien und ermitteln jedes Mal die durchschnittliche Anzahl von Tieren pro Familie.
Wenn wir ein Histogramm erstellen würden, um die durchschnittliche Anzahl der Tiere pro Familie in allen diesen Stichproben von 10 Familien darzustellen, würde es so aussehen:
Der Mittelwert dieser Stichprobenverteilung ist x = μ = 3
Die Varianz dieser Stichprobenverteilung beträgt s2 = σ2 / n = 6/10 = 0,6
Stichprobenziehung von 30
Stellen Sie sich nun vor, wir wiederholen das gleiche Experiment, nehmen dieses Mal jedoch immer wieder Zufallsstichproben von 30 Familien und ermitteln jedes Mal die durchschnittliche Anzahl von Tieren pro Familie.
Wenn wir ein Histogramm erstellen würden, um die durchschnittliche Anzahl der Tiere pro Familie in all diesen Stichproben von 30 Familien darzustellen, würde es so aussehen:
Der Mittelwert dieser Stichprobenverteilung ist x = μ = 3
Die Varianz dieser Stichprobenverteilung beträgt s2 = σ2 / n = 6/30 = 0,2
Zusammenfassung
Hier sind die wichtigsten Erkenntnisse aus diesen beiden Beispielen:
- Die Stichprobenverteilung eines Stichprobenmittelwerts ist annähernd normal, wenn die Stichprobengröße groß genug ist, auch wenn die Grundgesamtheitsverteilung nicht normal ist . In den beiden obigen Beispielen waren weder die gleichmäßige Verteilung noch die Chi-Quadrat-Verteilung normal (sie waren überhaupt nicht „glockenförmig“), aber als wir eine ausreichend große Stichprobe nahmen, schien sich die Verteilung des Stichprobenmittelwerts in eine normale Verteilung verändert zu haben sei normal.
- Je größer die Stichprobengröße, desto geringer ist die Varianz des Stichprobenmittelwerts.
Definieren Sie „groß genug“
Denken Sie daran, dass der zentrale Grenzwertsatz besagt, dass die Stichprobenverteilung eines Stichprobenmittelwerts annähernd normal ist, wenn die Stichprobengröße „groß genug“ ist, auch wenn die Grundgesamtheitsverteilung nicht normal ist.
Es gibt keine genaue Definition, wie groß eine Stichprobe sein sollte, damit der zentrale Grenzwertsatz Anwendung findet, aber im Allgemeinen hängt es von der Schiefe der Populationsverteilung ab, aus der die Stichprobe stammt:
- Wenn die Bevölkerungsverteilung symmetrisch ist, reicht manchmal eine Stichprobengröße von nur 15 aus.
- Bei einer schiefen Bevölkerungsverteilung ist in der Regel eine Stichprobe von mindestens 30 Personen erforderlich.
- Wenn die Bevölkerungsverteilung extrem schief ist, kann eine Stichprobe von 40 oder mehr Personen erforderlich sein.
Weitere Informationen zu diesem Thema finden Sie in diesem Tutorial zum Konditionieren einer großen Stichprobe .