De toestand van een groot monster: definitie en voorbeeld
In de statistiek willen we vaak steekproeven gebruiken om conclusies te trekken over populaties door middel van het testen van hypothesen of betrouwbaarheidsintervallen .
De meeste formules die we gebruiken bij het testen van hypothesen en betrouwbaarheidsintervallen gaan ervan uit dat een bepaalde steekproef grofweg eennormale verdeling volgt.
Om deze hypothese veilig te kunnen formuleren, moeten we er echter voor zorgen dat onze steekproefomvang groot genoeg is. Concreet moeten we ervoor zorgen dat aan de voorwaarde voor een grote steekproef wordt voldaan.
De grote steekproefvoorwaarde: de steekproefomvang is minimaal 30.
Opmerking: In sommige leerboeken wordt een “voldoende grote” steekproefomvang gedefinieerd als minimaal 40, maar het getal 30 wordt vaker gebruikt.
Wanneer aan deze voorwaarde is voldaan, kan worden aangenomen dat de steekproefverdeling van de steekproefgemiddelden ongeveer normaal is. Deze aanname stelt ons in staat steekproeven te gebruiken om conclusies te trekken over de populaties waaruit ze zijn getrokken.
De reden waarom het getal 30 wordt gebruikt, is gebaseerd op de centrale limietstelling. In deze blogpost kun je er meer over lezen.
Voorbeeld: het controleren van de status van een groot monster
Stel dat een bepaalde machine crackers maakt. De gewichtsverdeling van deze koekjes is scheef naar rechts met een gemiddelde van 10 ounces en een standaarddeviatie van 2 ounces. Als we een eenvoudige willekeurige steekproef nemen van 100 door deze machine geproduceerde koekjes, wat is dan de kans dat het gemiddelde gewicht van de koekjes in deze steekproef minder dan 9,8 gram bedraagt?
Om deze vraag te beantwoorden kunnen we de normale CDF-calculator gebruiken, maar eerst moeten we verifiëren dat de steekproefomvang groot genoeg is om aan te nemen dat de verdeling van het steekproefgemiddelde normaal is.
In dit voorbeeld is onze steekproefomvang n = 100 , wat veel groter is dan 30. Ondanks het feit dat de werkelijke verdeling van het koekjesgewicht naar rechts scheef is, kunnen we, aangezien onze steekproefomvang „groot genoeg“ is, ervan uitgaan dat de verdeling van het steekproefgemiddelde is normaal. We kunnen dus veilig de normale CDF-calculator gebruiken om dit probleem op te lossen.
Veranderingen in de toestand van grote monsters
Vaak wordt een steekproefomvang als ‘groot genoeg’ beschouwd als deze groter is dan of gelijk is aan 30, maar dit aantal kan enigszins variëren, afhankelijk van de onderliggende vorm van de populatieverdeling.
Speciaal:
- Als de populatieverdeling symmetrisch is, is een steekproefomvang van slechts 15 soms voldoende.
- Als de populatieverdeling scheef is, is doorgaans een steekproef van ten minste 30 personen nodig.
- Als de populatieverdeling extreem scheef is, kan een steekproef van 40 of meer mensen nodig zijn.
Afhankelijk van de vorm van de populatieverdeling heb je mogelijk een steekproefomvang groter of kleiner dan 30 nodig voordat de centrale limietstelling kan worden toegepast.
Aanvullende bronnen
Inleiding tot de centrale limietstelling
Inleiding tot steekproefverdelingen