De 10%-voorwaarde in statistieken: definitie en voorbeeld
Een Bernoulli-proef is een experiment met slechts twee mogelijke uitkomsten – ‘succes’ of ‘mislukking’ – en de kans op succes is elke keer dat het experiment wordt uitgevoerd hetzelfde.
Een voorbeeld van een Bernoulli-essay is het opgooien van munten. De munt kan slechts op twee kop landen (we zouden kop een „hit“ kunnen noemen en staart een „mislukking“) en de kans op succes bij elke opgooi is 0,5, ervan uitgaande dat de munt eerlijk is.
Als we in de statistiek waarschijnlijkheden willen berekenen waarbij meer dan een paar Bernoulli-pogingen betrokken zijn, gebruiken we vaak denormale verdeling als benadering. Om dit te doen moeten we er echter van uitgaan dat de onderzoeken onafhankelijk zijn.
In gevallen waarin onderzoeken niet echt onafhankelijk zijn, kunnen we er altijd van uitgaan dat dit wel het geval is, op voorwaarde dat de steekproefomvang waarmee we werken niet groter is dan 10% van de populatieomvang. Dit wordt de 10%-voorwaarde genoemd.
De 10%-voorwaarde: Zolang de steekproefomvang kleiner is dan of gelijk is aan 10% van de populatieomvang, kunnen we er altijd van uitgaan dat Bernoulli-tests onafhankelijk zijn.
Intuïtie achter de 10%-voorwaarde
Bekijk het volgende voorbeeld om een intuïtie achter de 10%-voorwaarde te ontwikkelen.
Stel dat het werkelijke percentage leerlingen in een bepaalde klas die de voorkeur geven aan voetbal boven basketbal 50% is. Stel dat de willekeurige variabele X het aantal studenten is dat willekeurig is geselecteerd in vier proeven en dat voetbal verkiest boven basketbal. Laten we zeggen dat we de waarschijnlijkheid willen begrijpen dat de vier willekeurig geselecteerde studenten voetbal verkiezen boven basketbal.
Als onze klasgrootte 20 leerlingen bedraagt en onze onderzoeken onafhankelijk waren (we zouden bijvoorbeeld herhaalde steekproeven kunnen nemen van alle 20 leerlingen), dan zou de kans dat elke leerling de voorkeur geeft aan voetbal boven basketbal als volgt kunnen worden berekend:
P(De 4 leerlingen geven de voorkeur aan voetbal) = 10/20 * 10/20 * 10/20 * 10/20 = .0625 .
Als onze onderzoeken echter niet onafhankelijk zijn (als we bijvoorbeeld een leerling hebben onderzocht, kan deze niet meer naar de klas worden teruggestuurd), dan wordt de kans dat alle vier de leerlingen de voorkeur geven aan voetbal als volgt berekend:
P(De 4 leerlingen geven de voorkeur aan voetbal) = 10/20 * 9/19 * 8/18 * 7/17 = .0433 .
Deze twee kansen zijn zeer verschillend. Bedenk dat in dit voorbeeld onze steekproefgrootte (4 studenten) niet kleiner is dan of gelijk is aan 10% van de populatie (20 studenten), dus we kunnen de voorwaarde van 10% niet gebruiken.
Bekijk echter de volgende tabel, die de waarschijnlijkheid laat zien dat de vier willekeurig geselecteerde leerlingen de voorkeur zouden geven aan voetbal, gebaseerd op de klasgrootte:

Naarmate de steekproefomvang in verhouding tot de populatieomvang (bijvoorbeeld ‚klassegrootte‘ in dit voorbeeld) afneemt, wordt de berekende waarschijnlijkheid tussen onafhankelijke onderzoeken en niet-onafhankelijke onderzoeken steeds dichterbij.
Merk op dat wanneer de steekproefomvang precies 10% van de populatieomvang bedraagt, het verschil tussen de kansen van onafhankelijke onderzoeken en niet-onafhankelijke onderzoeken relatief vergelijkbaar is.
En wanneer de steekproefomvang veel minder is dan 10% van de populatieomvang (bijvoorbeeld slechts 0,4% van de populatieomvang in de laatste rij van de tabel), zijn de kansen tussen onafhankelijke en niet-onafhankelijke onderzoeken extreem dichtbij.
Conclusie
De 10%-voorwaarde stelt dat onze steekproefomvang kleiner dan of gelijk moet zijn aan 10% van de populatieomvang om veilig te kunnen aannemen dat een reeks Bernoulli-onderzoeken onafhankelijk is.
Het is natuurlijk het beste als onze steekproefomvang ruim onder de 10% van de populatieomvang ligt, zodat onze conclusies over de populatie zo nauwkeurig mogelijk zijn. We zouden bijvoorbeeld liever hebben dat onze steekproefomvang slechts 5% van de bevolking bedraagt in plaats van 10%.
Aanvullende bronnen
Een inleiding tot de normale verdeling
 Een inleiding tot de binominale verdeling
 Een inleiding tot de centrale limietstelling