Steekproefvariantie vs. bevolkingsvariantie: wat is het verschil?
Variantie is een manier om de verdeling van waarden in een dataset te meten.
De formule voor het berekenen van de populatievariantie is:
σ 2 = Σ (x ik – μ) 2 / N
Goud:
- Σ : Een symbool dat “som” betekent
- μ : Bevolkingsgemiddelde
- x i : Het i- de element van de populatie
- N : Populatieomvang
De formule voor het berekenen van de steekproefvariantie is:
s 2 = Σ (x ik – X ) 2 / (n-1)
Goud:
- x : steekproefgemiddelde
- x i : Het i -de element van het monster
- n : Steekproefgrootte
Merk op dat er slechts een klein verschil is tussen de twee formules:
Wanneer we de populatievariantie berekenen, delen we door N (de omvang van de populatie).
Wanneer we de steekproefvariantie berekenen, delen we deze door n-1 (de steekproefomvang – 1).
Bij het berekenen van de steekproefvariantie passen we de zogenaamde Bessel-correctie toe, waarbij wordt gedeeld door n-1.
Zonder te verzanden in wiskundige details, kan het delen door n-1 een onbevooroordeelde schatting opleveren van de populatievariantie, wat de waarde is waarin we doorgaans toch geïnteresseerd zijn.
Wanneer moet de steekproefvariantie versus de populatievariantie worden berekend?
Als u niet zeker weet of u de steekproefvariantie of de populatievariantie moet berekenen, houd dan deze algemene regel in gedachten:
U moet de steekproefvariantie berekenen als de gegevensset waarmee u werkt een steekproef vertegenwoordigt die is genomen uit een grotere populatie waarin u geïnteresseerd bent.
U moet de populatievariantie berekenen als de dataset waarmee u werkt een gehele populatie vertegenwoordigt, dat wil zeggen elke waarde waarin u geïnteresseerd bent.
De volgende voorbeelden tonen verschillende scenario’s voor het berekenen van de steekproefvariantie versus de populatievariantie.
Voorbeeld: steekproefvariantie berekenen
Stel dat een botanicus de hoogtevariatie van een bepaalde plantensoort wil berekenen. Omdat er in een gebied duizenden individuele planten voorkomen, besluit ze een eenvoudige willekeurige steekproef van twintig planten te nemen en hun hoogte te meten.
In dit scenario moet de botanicus de steekproefvariantie berekenen omdat hij geïnteresseerd is in de variantie van de gehele plantenpopulatie, maar deze steekproef eenvoudigweg gebruikt om de werkelijke populatievariantie te schatten.
Voorbeeld: berekening van de populatievariantie
Stel dat een leraar de variantie wil berekenen van de examenscores van de twintig leerlingen in zijn klas.
In dit scenario moet de docent de populatievariantie berekenen, omdat de dataset waarmee hij werkt (de 20 examenresultaten) de gehele populatie van belang vertegenwoordigt.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u de steekproefvariantie en populatievariantie in verschillende statistische software kunt berekenen:
Hoe u de steekproef- en populatievariantie in Excel kunt berekenen
Hoe de steekproef- en populatievariantie in R te berekenen
Hoe de steekproef- en populatievariantie in Python te berekenen