Centrale limietstelling: definitie + voorbeelden
De centrale limietstelling stelt dat de steekproefverdeling van een steekproefgemiddelde bij benadering normaal is als de steekproefomvang groot genoeg is, zelfs als de populatieverdeling niet normaal is .
De centrale limietstelling stelt ook dat de steekproefverdeling de volgende eigenschappen zal hebben:
1. Het gemiddelde van de steekproefverdeling zal gelijk zijn aan het gemiddelde van de populatieverdeling:
x = µ
2. De variantie van de steekproefverdeling is gelijk aan de variantie van de populatieverdeling gedeeld door de steekproefomvang:
s2 = σ2 /n
Voorbeelden van de centrale limietstelling
Hier zijn enkele voorbeelden om de centrale limietstelling in de praktijk te illustreren.
Uniforme verdeling
Stel dat de breedte van het schild van een schildpad een uniforme verdeling volgt met een minimale breedte van 2 inch en een maximale breedte van 6 inch. Dat wil zeggen, als we willekeurig een schildpad selecteren en de breedte van zijn schild meten, is deze waarschijnlijk ook tussen de 5 en 15 centimeter breed .
Als we een histogram zouden maken om de verdeling van de breedte van de schildpadden weer te geven, zou het er als volgt uitzien:
Het gemiddelde van een uniforme verdeling is μ = (b+a) / 2, waarbij b de grootst mogelijke waarde is en a de kleinst mogelijke waarde. In dit geval is het (6+2) / 2 = 4.
De variantie van een uniforme verdeling is σ2 = (ba) 2/12 . In dit geval is het (6-2) 2/12 = 1,33
Het nemen van willekeurige steekproeven van 2 uit de uniforme verdeling
Stel je nu voor dat we een willekeurige steekproef van twee schildpadden uit deze populatie nemen en de breedte van het schild van elke schildpad meten. Laten we aannemen dat het schild van de eerste schildpad 7,5 cm breed is en de tweede 15 cm breed. De gemiddelde breedte van dit monster van 2 schildpadden is 10,5 cm.
Stel je vervolgens voor dat we nog een willekeurige steekproef van 2 schildpadden uit deze populatie nemen en opnieuw de schaalbreedte van elke schildpad meten. Laten we aannemen dat het schild van de eerste schildpad 6,5 cm breed is en de tweede ook 6,5 cm breed. De gemiddelde breedte van dit monster van 2 schildpadden is 2,5 inch.
Stel je voor dat we steeds opnieuw willekeurige monsters van 2 schildpadden nemen en telkens de gemiddelde schaalbreedte vinden.
Als we een histogram zouden maken dat de gemiddelde schaalbreedte van al deze monsters van twee schildpadden weergeeft, zou het er als volgt uitzien:
Dit wordt de steekproefverdeling voor de steekproefgemiddelden genoemd, omdat deze de verdeling van de steekproefgemiddelden weergeeft.
Het gemiddelde van deze steekproefverdeling is x = μ = 4
De variantie van deze steekproefverdeling is s2 = σ2 / n = 1,33 / 2 = 0,665
Het nemen van willekeurige steekproeven van 5 uit de uniforme verdeling
Stel je nu voor dat we hetzelfde experiment herhalen, maar deze keer nemen we keer op keer willekeurige monsters van 5 schildpadden en vinden elke keer de gemiddelde schaalbreedte.
Als we een histogram zouden maken dat de gemiddelde schaalbreedte van al deze monsters van vijf schildpadden weergeeft, zou het er als volgt uitzien:
Merk op dat deze verdeling meer de vorm van een klok heeft, die lijkt opde normale verdeling . Dit komt doordat wanneer we monsters van 5 nemen, de variantie tussen onze steekproefgemiddelden veel kleiner is, waardoor het minder waarschijnlijk is dat we monsters krijgen met een gemiddelde van bijna 2 inch of 6 inch en eerder monsters krijgen van gemiddeld bijna 2 inch of 6 inch. 6 inch. het gemiddelde ligt 10 cm dichter bij het werkelijke bevolkingsgemiddelde.
Het gemiddelde van deze steekproefverdeling is x = μ = 4
De variantie van deze steekproefverdeling is s2 = σ2 / n = 1,33 / 5 = 0,266
Het nemen van willekeurige steekproeven van 30 uit de uniforme verdeling
Stel je nu voor dat we hetzelfde experiment herhalen, maar deze keer nemen we keer op keer willekeurige monsters van 30 schildpadden en vinden elke keer de gemiddelde schaalbreedte.
Als we een histogram zouden maken dat de gemiddelde schaalbreedte van al deze monsters van 30 schildpadden weergeeft, zou het er als volgt uitzien:
Merk op dat deze steekproefverdeling nog klokvormiger en veel smaller is dan de vorige twee verdelingen.
Het gemiddelde van deze steekproefverdeling is x = μ = 4
De variantie van deze steekproefverdeling is s2 = σ2 / n = 1,33 / 30 = 0,044
De chikwadraatverdeling
Stel dat het aantal huisdieren per gezin in een bepaalde stad een chi-kwadraatverdeling volgt met drie vrijheidsgraden. Als we een histogram zouden maken om de verdeling van dieren per familie weer te geven, zou het er als volgt uitzien:
Het gemiddelde van een chikwadraatverdeling is eenvoudigweg het aantal vrijheidsgraden (df). In dit geval is μ = 3 .
De variantie van een Chi-kwadraatverdeling is 2 * df. In dit geval is σ2 = 2 * 3 = 6 .
Het nemen van willekeurige monsters van 2
Stel je voor dat we een willekeurige steekproef nemen van 2 gezinnen uit deze populatie en het aantal huisdieren in elk gezin tellen. Stel dat het eerste gezin 4 huisdieren heeft en het tweede gezin 1 huisdier. Het gemiddelde aantal huisdieren voor deze steekproef van 2 gezinnen is 2,5.
Stel je dan voor dat we nog een willekeurige steekproef van 2 gezinnen uit deze populatie nemen en het aantal huisdieren in elk gezin opnieuw tellen. Stel dat het eerste gezin 6 huisdieren heeft en het tweede gezin 4 huisdieren. Het gemiddelde aantal huisdieren voor deze steekproef van 2 gezinnen is 5.
Stel je voor dat we steeds opnieuw willekeurige monsters van 2 gezinnen nemen en telkens het gemiddelde aantal huisdieren vinden.
Als we een histogram zouden maken dat het gemiddelde aantal huisdieren van al deze monsters uit 2 gezinnen weergeeft, zou het er als volgt uitzien:
Het gemiddelde van deze steekproefverdeling is x = μ = 3
De variantie van deze steekproefverdeling is s 2 = σ 2 / n = 6 / 2 = 3
Het nemen van willekeurige steekproeven van 10
Stel je nu voor dat we hetzelfde experiment herhalen, maar deze keer nemen we keer op keer willekeurige steekproeven van 10 families en vinden elke keer het gemiddelde aantal dieren per familie.
Als we een histogram zouden maken dat het gemiddelde aantal dieren per familie in al deze steekproeven van 10 families weergeeft, zou het er als volgt uitzien:
Het gemiddelde van deze steekproefverdeling is x = μ = 3
De variantie van deze steekproefverdeling is s2 = σ2 / n = 6/10 = 0,6
Het nemen van willekeurige steekproeven van 30
Stel je nu voor dat we hetzelfde experiment herhalen, maar deze keer nemen we keer op keer willekeurige steekproeven van 30 families en vinden we elke keer het gemiddelde aantal dieren per familie.
Als we een histogram zouden maken dat het gemiddelde aantal dieren per familie weergeeft in al deze steekproeven van 30 families, zou het er als volgt uitzien:
Het gemiddelde van deze steekproefverdeling is x = μ = 3
De variantie van deze steekproefverdeling is s2 = σ2 / n = 6/30 = 0,2
Samenvatting
Dit zijn de belangrijkste conclusies uit deze twee voorbeelden:
- De steekproefverdeling van een steekproefgemiddelde is bij benadering normaal als de steekproefomvang groot genoeg is, zelfs als de populatieverdeling niet normaal is . In de twee bovenstaande voorbeelden waren noch de uniforme verdeling, noch de chikwadraatverdeling normaal (ze hadden helemaal geen klokvorm), maar toen we een steekproef namen die groot genoeg was, is de verdeling van het steekproefgemiddelde veranderd in een schijnbaar normaal zijn.
- Hoe groter de steekproefomvang, hoe lager de variantie van het steekproefgemiddelde.
Definieer “groot genoeg”
Bedenk dat de centrale limietstelling stelt dat de steekproefverdeling van een steekproefgemiddelde bij benadering normaal is als de steekproefomvang „groot genoeg“ is, zelfs als de populatieverdeling niet normaal is.
Er is geen exacte definitie van hoe groot een steekproef zou moeten zijn voordat de centrale limietstelling van toepassing is, maar in het algemeen hangt dit af van de scheefheid van de populatieverdeling waaruit de steekproef voortkomt:
- Als de populatieverdeling symmetrisch is, is een steekproefomvang van slechts 15 soms voldoende.
- Als de populatieverdeling scheef is, is doorgaans een steekproef van ten minste 30 personen nodig.
- Als de populatieverdeling extreem scheef is, kan een steekproef van 40 of meer mensen nodig zijn.
Bekijk deze tutorial over het conditioneren van een groot monster voor meer informatie over dit onderwerp.