Was ist die pass/fail-bedingung in der statistik?
Ein Bernoulli-Versuch ist ein Experiment mit nur zwei möglichen Ergebnissen – „Erfolg“ oder „Misserfolg“ – und die Erfolgswahrscheinlichkeit ist bei jeder Durchführung des Experiments gleich.
Ein Beispiel für einen Bernoulli-Aufsatz ist ein Münzwurf. Die Münze kann nur auf zwei Köpfen landen (wir könnten Kopf als „Treffer“ und Zahl als „Misserfolg“ bezeichnen) und die Erfolgswahrscheinlichkeit bei jedem Wurf beträgt 0,5, vorausgesetzt, die Münze ist fair.
Wenn wir in der Statistik Wahrscheinlichkeiten berechnen möchten, die mehr als ein paar Bernoulli-Versuche umfassen, verwenden wir häufig dieNormalverteilung als Näherungswert. Dazu müssen wir jedoch prüfen, ob die Pass/Fail-Bedingung erfüllt ist:
Pass/Fail-Bedingung: Eine Stichprobe muss mindestens 10 erwartete Erfolge und 10 erwartete Misserfolge aufweisen, um die Normalverteilung als Näherungswert verwenden zu können.
In Notation geschrieben müssen wir die folgenden zwei Dinge überprüfen:
- Die erwartete Erfolgszahl beträgt mindestens 10: np ≥ 10
- Die erwartete Anzahl von Ausfällen beträgt mindestens 10: n(1-p) ≥ 10
Dabei ist n die Stichprobengröße und p die Erfolgswahrscheinlichkeit für einen bestimmten Versuch.
Hinweis: In einigen Handbüchern heißt es stattdessen, dass nur 5 erwartete Erfolge und 5 erwartete Misserfolge erforderlich sind, um die normale Näherung zu verwenden. Allerdings wird 10 häufiger verwendet und ist eine konservativere Zahl. Daher werden wir diese Nummer in diesem Tutorial verwenden.
Beispiel: Überprüfung der Pass/Fail-Bedingung
Angenommen, wir möchten ein Konfidenzintervall für den Anteil der Einwohner eines Landkreises erstellen, die ein bestimmtes Gesetz befürworten. Wir wählen eine Zufallsstichprobe von 100 Einwohnern aus und fragen sie, wie sie zum Gesetz stehen. Hier sind die Ergebnisse:
- Stichprobengröße n = 100
- Anteil der Befürworter des Gesetzes p = 0,56
Zur Berechnung des Konfidenzintervalls möchten wir folgende Formel verwenden:
Konfidenzintervall = p +/- z*√ p(1-p) / n
Gold:
- p: Stichprobenanteil
- z: der z-Wert, der der Normalverteilung entspricht
- n: Stichprobengröße
Diese Formel verwendet einen z-Wert aus der Normalverteilung. In dieser Formel verwenden wir also die Normalverteilung, um die Binomialverteilung anzunähern.
Dazu müssen wir jedoch überprüfen, ob die Pass/Fail-Bedingung erfüllt ist. Überprüfen wir, ob die Anzahl der Erfolge und die Anzahl der Fehler in der Stichprobe mindestens 10 beträgt:
Anzahl der Erfolge: np = 100*.56 = 56
Anzahl der Ausfälle: n(1-p) = 100*(1-.56) = 44
Da beide Zahlen gleich oder größer als 10 sind, können wir die obige Formel zur Berechnung des Konfidenzintervalls verwenden.
Zusätzliche Ressourcen
Eine weitere Bedingung, die erfüllt sein muss, um die Normalverteilung als Näherung für die Binomialverteilung zu verwenden, ist, dass die Stichprobengröße, mit der wir arbeiten, 10 % der Grundgesamtheit nicht überschreitet. Dies wird als 10 %-Bedingung bezeichnet.
Bedenken Sie außerdem, dass Sie, wenn Sie mit zwei Anteilen arbeiten (z. B. ein Konfidenzintervall für die Differenz zwischen den Anteilen erstellen ), überprüfen müssen, dass die erwartete Anzahl an Erfolgen und Misserfolgen in den beiden Stichproben mindestens 10 beträgt.