Der zustand einer großen stichprobe: definition und beispiel
In der Statistik möchten wir häufig Stichproben verwenden, um durch Hypothesentests oderKonfidenzintervalle Rückschlüsse auf Populationen zu ziehen.
Die meisten Formeln, die wir für Hypothesentests und Konfidenzintervalle verwenden, gehen davon aus, dass eine gegebene Stichprobe ungefähr einerNormalverteilung folgt.
Um diese Hypothese sicher formulieren zu können, müssen wir jedoch sicherstellen, dass unsere Stichprobengröße groß genug ist. Insbesondere müssen wir sicherstellen, dass die Bedingung für eine große Stichprobe erfüllt ist.
Die Bedingung für eine große Stichprobe: Die Stichprobengröße beträgt mindestens 30.
Hinweis: In einigen Lehrbüchern wird eine „ausreichend große“ Stichprobengröße mit mindestens 40 definiert, die Zahl 30 wird jedoch häufiger verwendet.
Wenn diese Bedingung erfüllt ist, kann davon ausgegangen werden, dass die Stichprobenverteilung der Stichprobenmittelwerte annähernd normal ist. Diese Annahme ermöglicht es uns, anhand von Stichproben Rückschlüsse auf die Populationen zu ziehen, aus denen sie stammen.
Der Grund, warum die Zahl 30 verwendet wird, basiert auf dem zentralen Grenzwertsatz. Mehr dazu können Sie in diesem Blogbeitrag lesen.
Beispiel: Überprüfen des Status einer großen Stichprobe
Angenommen, eine bestimmte Maschine stellt Cracker her. Die Gewichtsverteilung dieser Kekse ist mit einem Mittelwert von 10 Unzen und einer Standardabweichung von 2 Unzen rechtsschief. Wenn wir eine einfache Zufallsstichprobe von 100 von dieser Maschine hergestellten Keksen nehmen, wie groß ist dann die Wahrscheinlichkeit, dass das durchschnittliche Gewicht der Kekse in dieser Stichprobe weniger als 9,8 Unzen beträgt?
Um diese Frage zu beantworten, können wir den normalen CDF-Rechner verwenden. Zuerst müssen wir jedoch überprüfen, ob die Stichprobengröße groß genug ist, um anzunehmen, dass die Verteilung des Stichprobenmittelwerts normal ist.
In diesem Beispiel beträgt unsere Stichprobengröße n = 100 , was viel größer als 30 ist. Trotz der Tatsache, dass die wahre Cookie-Gewichtsverteilung nach rechts verzerrt ist, können wir davon ausgehen, dass die Verteilung, da unsere Stichprobengröße „groß genug“ ist des Stichprobenmittelwerts ist normal. Wir könnten also getrost den normalen CDF-Rechner verwenden, um dieses Problem zu lösen.
Änderungen des Zustands großer Proben
Oft gilt eine Stichprobengröße als „groß genug“, wenn sie größer oder gleich 30 ist, diese Zahl kann jedoch je nach der zugrunde liegenden Form der Bevölkerungsverteilung leicht variieren.
Besonders:
- Wenn die Bevölkerungsverteilung symmetrisch ist, reicht manchmal eine Stichprobengröße von nur 15 aus.
- Bei einer schiefen Bevölkerungsverteilung ist in der Regel eine Stichprobe von mindestens 30 Personen erforderlich.
- Wenn die Bevölkerungsverteilung extrem schief ist, kann eine Stichprobe von 40 oder mehr Personen erforderlich sein.
Abhängig von der Form der Populationsverteilung benötigen Sie möglicherweise eine Stichprobengröße von mehr oder weniger als 30, damit der zentrale Grenzwertsatz angewendet werden kann.
Zusätzliche Ressourcen
Einführung in den zentralen Grenzwertsatz
Einführung in Stichprobenverteilungen