Wat is steekproefvariabiliteit? definitie & voorbeeld
Vaak willen we in de statistiek vragen beantwoorden als:
- Wat is het gemiddelde gezinsinkomen in een bepaalde staat?
- Wat is het gemiddelde gewicht van een bepaalde schildpadsoort?
- Wat is de gemiddelde opkomst bij universiteitsvoetbalwedstrijden?
In elk scenario willen we een vraag beantwoorden over een populatie , die alle mogelijke individuele elementen vertegenwoordigt die we willen meten.
In plaats van gegevens te verzamelen over elk individu in een populatie, verzamelen we echter gegevens over een steekproef van de populatie, die een deel van de totale populatie vertegenwoordigt.
We willen bijvoorbeeld het gemiddelde gewicht weten van een bepaalde schildpadsoort, die een totale populatie van 800 schildpadden heeft.
Omdat het te lang zou duren om elke schildpad in de populatie te lokaliseren en te wegen, verzamelen we in plaats daarvan een eenvoudige willekeurige steekproef van 30 schildpadden en wegen deze:
We zouden dan het gemiddelde gewicht van dit monster schildpadden kunnen gebruiken om het gemiddelde gewicht van alle schildpadden in de populatie te schatten.
Steekproefvariabiliteit verwijst naar het feit dat het gemiddelde van monster tot monster zal variëren.
In een willekeurige steekproef van 30 schildpadden kan het steekproefgemiddelde bijvoorbeeld 350 pond bedragen. In een andere willekeurige steekproef kan het steekproefgemiddelde 345 pond zijn. In nog een ander monster kan het monstergemiddelde 355 pond zijn.
Er is variatie tussen de steekproefgemiddelden.
Hoe de steekproefvariabiliteit te meten
In de praktijk verzamelen we slechts één steekproef om een populatieparameter te schatten. We verzamelen bijvoorbeeld slechts één monster van 30 zeeschildpadden om het gemiddelde gewicht van de gehele schildpaddenpopulatie te schatten.
Dit betekent dat we slechts één steekproefgemiddelde ( x ) zullen berekenen en dit zullen gebruiken om het populatiegemiddelde (μ) te schatten.
Steekproefgemiddelde = x
Maar we weten dat de steekproefgemiddelden variëren van monster tot monster. Om rekening te houden met deze variabiliteit kunnen we de volgende formule gebruiken om de standaarddeviatie van het steekproefgemiddelde te schatten:
Standaardafwijking van steekproefgemiddelde = s/ √n
Goud:
- s: de standaarddeviatie van het monster
- n: De steekproefomvang
Stel dat we bijvoorbeeld een monster van 30 zeeschildpadden verzamelen en vaststellen dat het gemiddelde gewicht van het monster 350 pond is en de standaardafwijking van het monster 12 pond is. Op basis van deze cijfers berekenen we:
Steekproefgemiddelde = 350 boeken
Standaardafwijking van steekproefgemiddelde = 12 / √ 30 = 2,19 pond
Dit betekent dat onze beste schatting van het werkelijke populatiegemiddelde gewicht van alle schildpadden 350 pond bedraagt, maar we mogen verwachten dat het steekproefgemiddelde zal variëren met een standaardafwijking van ongeveer 2,19 pond.
Een interessante eigenschap van de standaarddeviatie van het steekproefgemiddelde is dat deze van nature kleiner wordt naarmate we steeds grotere steekproefomvang gebruiken.
Stel bijvoorbeeld dat we een steekproef van 100 zeeschildpadden verzamelen en vaststellen dat het gemiddelde gewicht van de steekproef 350 pond is en de standaarddeviatie van de steekproef 12 pond. De standaardafwijking van het steekproefgemiddelde wordt dan als volgt berekend:
Standaardafwijking van steekproefgemiddelde = 12 / √ 100 = 1,2 pond
Onze beste schatting van het steekproefgemiddelde zou nog steeds 350 pond zijn, maar we kunnen verwachten dat het gemiddelde van de ene steekproef van 100 zeeschildpadden tot de volgende steekproef van 100 zeeschildpadden varieert met één standaardafwijking van slechts 1,2 pond.
Met andere woorden: er is minder variatie tussen de steekproefgemiddelden wanneer de steekproefomvang groter is.
Aanvullende bronnen
Wat is een steekproefverdeling?
Een inleiding tot de centrale limietstelling
Centrale limietstelling rekenmachine