Die 10 %-bedingung in der statistik: definition & beispiel
Ein Bernoulli-Versuch ist ein Experiment mit nur zwei möglichen Ergebnissen – „Erfolg“ oder „Misserfolg“ – und die Erfolgswahrscheinlichkeit ist bei jeder Durchführung des Experiments gleich.
Ein Beispiel für einen Bernoulli-Aufsatz ist ein Münzwurf. Die Münze kann nur auf zwei Köpfen landen (wir könnten Kopf als „Treffer“ und Zahl als „Misserfolg“ bezeichnen) und die Erfolgswahrscheinlichkeit bei jedem Wurf beträgt 0,5, vorausgesetzt, die Münze ist fair.
Wenn wir in der Statistik Wahrscheinlichkeiten berechnen möchten, die mehr als ein paar Bernoulli-Versuche umfassen, verwenden wir häufig dieNormalverteilung als Näherungswert. Dazu müssen wir jedoch davon ausgehen, dass die Studien unabhängig sind.
In Fällen, in denen Studien nicht wirklich unabhängig sind, können wir immer davon ausgehen, dass dies der Fall ist, wenn die Stichprobengröße, mit der wir arbeiten, 10 % der Populationsgröße nicht überschreitet. Dies wird als 10 %-Bedingung bezeichnet.
Die 10 %-Bedingung: Solange die Stichprobengröße kleiner oder gleich 10 % der Grundgesamtheitsgröße ist, können wir immer davon ausgehen, dass Bernoulli-Tests unabhängig sind.
Intuition hinter der 10 %-Bedingung
Um eine Intuition hinter der 10 %-Bedingung zu entwickeln, betrachten Sie das folgende Beispiel.
Gehen Sie davon aus, dass der tatsächliche Anteil der Schüler einer bestimmten Klasse, die Fußball dem Basketball vorziehen, 50 % beträgt. Die Zufallsvariable X sei die Anzahl der in vier Versuchen zufällig ausgewählten Schüler, die Fußball dem Basketball vorziehen. Nehmen wir an, wir möchten die Wahrscheinlichkeit verstehen, dass die 4 zufällig ausgewählten Schüler Fußball dem Basketball vorziehen.
Wenn unsere Klassengröße 20 Schüler beträgt und unsere Versuche unabhängig wären (wir könnten beispielsweise wiederholte Stichproben aller 20 Schüler nehmen), dann könnte die Wahrscheinlichkeit, dass jeder Schüler Fußball dem Basketball vorzieht, wie folgt berechnet werden:
P(Die 4 Schüler bevorzugen Fußball) = 10/20 * 10/20 * 10/20 * 10/20 = .0625 .
Wenn unsere Versuche jedoch nicht unabhängig sind (z. B. wenn wir einen Schüler befragt haben, kann dieser nicht mehr in den Unterricht zurückkehren), dann würde die Wahrscheinlichkeit, dass alle vier Schüler Fußball bevorzugen würden, wie folgt berechnet:
P(Die 4 Schüler bevorzugen Fußball) = 10/20 * 9/19 * 8/18 * 7/17 = .0433 .
Diese beiden Wahrscheinlichkeiten sind sehr unterschiedlich. Bedenken Sie, dass in diesem Beispiel unsere Stichprobengröße (4 Studenten) nicht kleiner oder gleich 10 % der Grundgesamtheit (20 Studenten) ist, sodass wir die 10 %-Bedingung nicht verwenden können.
Betrachten Sie jedoch die folgende Tabelle, die die Wahrscheinlichkeit zeigt, dass die vier zufällig ausgewählten Schüler basierend auf der Klassengröße Fußball bevorzugen würden:
Wenn die Stichprobengröße im Verhältnis zur Populationsgröße (z. B. „Klassengröße“ in diesem Beispiel) abnimmt, nähert sich die berechnete Wahrscheinlichkeit zwischen unabhängigen Versuchen und nicht unabhängigen Versuchen immer mehr an.
Beachten Sie, dass der Unterschied zwischen den Wahrscheinlichkeiten unabhängiger Versuche und nicht unabhängiger Versuche relativ ähnlich ist, wenn die Stichprobengröße genau 10 % der Grundgesamtheit beträgt.
Und wenn die Stichprobengröße viel weniger als 10 % der Grundgesamtheit beträgt (z. B. nur 0,4 % der Grundgesamtheit in der letzten Zeile der Tabelle), liegen die Wahrscheinlichkeiten zwischen unabhängigen und nicht unabhängigen Versuchen äußerst nahe beieinander.
Abschluss
Die 10 %-Bedingung besagt, dass unsere Stichprobengröße kleiner oder gleich 10 % der Populationsgröße sein muss, um sicher davon ausgehen zu können, dass eine Reihe von Bernoulli-Versuchen unabhängig ist.
Natürlich ist es am besten, wenn unsere Stichprobengröße deutlich unter 10 % der Grundgesamtheit liegt, damit unsere Rückschlüsse auf die Grundgesamtheit so genau wie möglich sind. Beispielsweise würden wir es vorziehen, dass unsere Stichprobengröße nur 5 % der Bevölkerung beträgt, statt 10 %.
Zusätzliche Ressourcen
Eine Einführung in die Normalverteilung
Eine Einführung in die Binomialverteilung
Eine Einführung in den zentralen Grenzwertsatz