Steekproefvariantie vs. bevolkingsvariantie: wat is het verschil?

Von Dr.benjamin anderson Juli 23, 2023 Gids Keine Kommentare

Variantie is een manier om de verdeling van waarden in een dataset te meten.

De formule voor het berekenen van de populatievariantie is:

σ ² = Σ (x _ik – μ) ² / N

Goud:

Σ : Een symbool dat “som” betekent
μ : Bevolkingsgemiddelde
x _i : Het i- ^de element van de populatie
N : Populatieomvang

De formule voor het berekenen van de steekproefvariantie is:

s ² = Σ (x _ik – X ) ² / (n-1)

Goud:

x : steekproefgemiddelde
x _i : Het i ^-de element van het monster
n : Steekproefgrootte

Merk op dat er slechts een klein verschil is tussen de twee formules:

Wanneer we de populatievariantie berekenen, delen we door N (de omvang van de populatie).

Wanneer we de steekproefvariantie berekenen, delen we deze door n-1 (de steekproefomvang – 1).

Bij het berekenen van de steekproefvariantie passen we de zogenaamde Bessel-correctie toe, waarbij wordt gedeeld door n-1.

Zonder te verzanden in wiskundige details, kan het delen door n-1 een onbevooroordeelde schatting opleveren van de populatievariantie, wat de waarde is waarin we doorgaans toch geïnteresseerd zijn.

Wanneer moet de steekproefvariantie versus de populatievariantie worden berekend?

Als u niet zeker weet of u de steekproefvariantie of de populatievariantie moet berekenen, houd dan deze algemene regel in gedachten:

U moet de steekproefvariantie berekenen als de gegevensset waarmee u werkt een steekproef vertegenwoordigt die is genomen uit een grotere populatie waarin u geïnteresseerd bent.

U moet de populatievariantie berekenen als de dataset waarmee u werkt een gehele populatie vertegenwoordigt, dat wil zeggen elke waarde waarin u geïnteresseerd bent.

De volgende voorbeelden tonen verschillende scenario’s voor het berekenen van de steekproefvariantie versus de populatievariantie.

Voorbeeld: steekproefvariantie berekenen

Stel dat een botanicus de hoogtevariatie van een bepaalde plantensoort wil berekenen. Omdat er in een gebied duizenden individuele planten voorkomen, besluit ze een eenvoudige willekeurige steekproef van twintig planten te nemen en hun hoogte te meten.

In dit scenario moet de botanicus de steekproefvariantie berekenen omdat hij geïnteresseerd is in de variantie van de gehele plantenpopulatie, maar deze steekproef eenvoudigweg gebruikt om de werkelijke populatievariantie te schatten.

Voorbeeld: berekening van de populatievariantie

Stel dat een leraar de variantie wil berekenen van de examenscores van de twintig leerlingen in zijn klas.

In dit scenario moet de docent de populatievariantie berekenen, omdat de dataset waarmee hij werkt (de 20 examenresultaten) de gehele populatie van belang vertegenwoordigt.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u de steekproefvariantie en populatievariantie in verschillende statistische software kunt berekenen:

Hoe u de steekproef- en populatievariantie in Excel kunt berekenen
Hoe de steekproef- en populatievariantie in R te berekenen
Hoe de steekproef- en populatievariantie in Python te berekenen

Über den Autor

Dr.benjamin anderson

Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder