Wat is een representatieve steekproef en waarom is deze belangrijk?


In de statistiek zijn we vaak geïnteresseerd in het bestuderen van de kenmerken van specifieke populaties. We zijn bijvoorbeeld geïnteresseerd in het bestuderen van:

  • De algemene werktevredenheid van werktuigbouwkundigen in een bepaalde stad.
  • Politieke voorkeuren van individuen in een bepaalde provincie.
  • De leeftijdsverdeling van individuen in een bepaald land.
  • Filmische voorkeuren van leerlingen van een bepaalde school.

In elk van deze voorbeelden willen we een bepaalde populatie beter begrijpen.

Populatie: De gehele groep individuen die u wilt bestuderen.

Helaas kan het verzamelen van gegevens over elk individu in een populatie kostbaar en tijdrovend zijn. Dit is de reden waarom onderzoekers doorgaans gegevens verzamelen over een steekproef van een populatie en vervolgens de resultaten van de steekproef generaliseren naar de gehele populatie.

Steekproef: een subset van de populatie.

Laten we bijvoorbeeld zeggen dat we inzicht willen krijgen in de filmvoorkeuren van leerlingen op een bepaalde school, die in totaal 1000 leerlingen heeft. Omdat het te lang zou duren om elke student individueel te ondervragen, zouden we in plaats daarvan een willekeurige steekproef van 100 studenten kunnen nemen en hen naar hun voorkeuren kunnen vragen.

De 1.000 studenten vertegenwoordigen de populatie, terwijl de 100 willekeurig geselecteerde studenten de steekproef vertegenwoordigen. Zodra we gegevens hebben verzameld voor een steekproef van 100 studenten, kunnen we deze resultaten generaliseren naar de totale populatie van 1000 studenten, maar alleen als onze steekproef representatief is voor onze populatie .

Representatieve steekproef: Een steekproef waarin de kenmerken van individuen nauw aansluiten bij de kenmerken van de totale populatie.

Idealiter willen we dat onze steekproef lijkt op een ‘miniversie’ van onze populatie. Als de totale studentenpopulatie dus voor 50% uit meisjes en voor 50% uit jongens bestaat, zou onze steekproef niet representatief zijn als deze voor 90% uit jongens en slechts 10% uit meisjes zou bestaan.

Voorbeeld van een steekproef die niet representatief is voor een populatie

Of, als de totale bevolking uit gelijke delen eerstejaars, tweedejaars, junioren en senioren bestaat, dan zou onze steekproef niet representatief zijn als deze alleen eerstejaars zou omvatten.

Een steekproef die niet representatief is voor een populatie

Het belang van het verkrijgen van een representatieve steekproef

De reden dat we een representatieve steekproef willen, is dat we de resultaten van de steekproef met vertrouwen kunnen generaliseren naar de populatie.

Laten we bijvoorbeeld zeggen dat we willen weten welk percentage van de leerlingen op een bepaalde school de voorkeur geeft aan ‚drama‘ als hun favoriete filmgenre. Als de totale studentenpopulatie uit een mix van 50% jongens en 50% meisjes bestaat, zou een steekproef bestaande uit 90% jongens en 10% meisjes tot vertekende resultaten kunnen leiden als aanzienlijk minder jongens theater als favoriet genre verkiezen.

Of, als de totale populatie een gelijke mix is van eerstejaars, tweedejaars, junioren en senioren, dan zou een steekproef die alleen eerstejaarsstudenten omvat ook tot vertekende resultaten kunnen leiden als jongere studenten (bijvoorbeeld eerstejaarsstudenten) de voorkeur geven aan theater in een veel hoger tempo dan eerstejaarsstudenten. oudere studenten.

Als de kenmerken van individuen in onze steekproef niet nauw overeenkomen met de kenmerken van individuen in de totale populatie, kunnen we de resultaten van de steekproef niet met vertrouwen generaliseren naar de algehele populatie.

Hoe u een representatief monster kunt verkrijgen

Om de kans op het verkrijgen van een representatieve steekproef te maximaliseren, moeten we ons bij het verkrijgen van onze steekproef op twee dingen concentreren:

1. Gebruik een geschikte bemonsteringsmethode.

Er zijn veel manieren om een steekproef uit een populatie te verkrijgen , maar hier zijn drie methoden waarmee u een representatieve steekproef kunt verkrijgen:

Eenvoudige willekeurige steekproef: selecteer willekeurige individuen met behulp van een willekeurige getallengenerator of willekeurige selectiemiddelen.

  • Voorbeeld: Wijs een getal toe aan de 1.000 studenten. Gebruik vervolgens een generator voor willekeurige getallen om 100 willekeurige getallen te selecteren en gebruik de overeenkomstige studenten als voorbeeldleden.
  • Voordeel: Eenvoudige willekeurige steekproeven zijn over het algemeen representatief voor de populatie van interesse, aangezien elk lid een gelijke kans heeft om in de steekproef te worden opgenomen.

Systematische willekeurige steekproef: plaats elk lid van een populatie in een bepaalde volgorde. Kies een willekeurig startpunt en selecteer één lid uit n om deel uit te maken van de steekproef.

  • Voorbeeld: Maak een alfabetische lijst op basis van de achternaam van alle 1.000 studenten, kies willekeurig een startpunt en kies elke tiende student die in de steekproef moet worden opgenomen.
  • Voordeel: Systematische willekeurige steekproeven zijn over het algemeen representatief voor de populatie van interesse, aangezien elk lid een gelijke kans heeft om in de steekproef te worden opgenomen.

Gestratificeerde willekeurige steekproef: verdeel een populatie in groepen. Selecteer willekeurig een paar leden uit elke groep om deel uit te maken van de steekproef.

  • Voorbeeld: Verdeel alle studenten op basis van hun niveau: eerstejaars, tweedejaars, junioren en senioren. Selecteer willekeurig 25 leerlingen uit elke klas om deel uit te maken van de steekproef.
  • Voordeel: Gestratificeerde willekeurige steekproeven zorgen ervoor dat een gelijk aantal leerlingen uit elke klas in de steekproef wordt opgenomen.

2. Zorg ervoor dat het monster groot genoeg is.

Naast het gebruik van een geschikte steekproefmethode is het belangrijk om ervoor te zorgen dat de steekproef groot genoeg is, zodat we over voldoende gegevens beschikken om te kunnen generaliseren naar een grotere populatie.

Een steekproef van acht leerlingen – één jongen en één meisje uit elke klas – zou bijvoorbeeld een miniversie van de populatie als geheel kunnen vertegenwoordigen, maar deze is waarschijnlijk niet groot genoeg om alle variabiliteit weer te geven die van nature bestaat in de antwoorden van de leerlingen. .

Dus hoe groot moet uw steekproef zijn?

Het hangt af van de volgende factoren:

  • Populatieomvang: Over het algemeen geldt: hoe groter de populatieomvang, hoe groter de steekproef zou moeten zijn. U hebt bijvoorbeeld een veel grotere steekproef nodig als u uw resultaten wilt generaliseren naar een heel land in plaats van naar één enkele stad.
  • Betrouwbaarheidsniveau: Hoe zeker u ervan wilt zijn dat de werkelijke waarde van de populatie waarin u geïnteresseerd bent, binnen uw betrouwbaarheidsinterval ligt. Gemeenschappelijke betrouwbaarheidsniveaus zijn 90%, 95% en 99%. Hoe hoger het betrouwbaarheidsniveau, hoe groter uw steekproef zou moeten zijn.
  • Foutmarge: hoeveel fouten u bereid bent te tolereren. Geen enkel monster zal perfect zijn, dus u moet bereid zijn op zijn minst een zekere mate van fouten te accepteren. De meeste onderzoeken rapporteren hun resultaten met een foutenmarge, bijvoorbeeld „40% van de studenten zei dat theater hun favoriete filmgenre was, met een foutenmarge van +/- 5%.“ » Hoe lager de foutmarge, hoe kleiner uw steekproef zou moeten zijn.

Er zijn online veel rekenmachines voor de steekproefomvang waarmee u uw steekproefomvang kunt bepalen op basis van deze factoren. Deze rekenmachine van Survey Monkey is bijzonder eenvoudig te gebruiken.

Dingen om in gedachten te houden

Zelfs als u een juiste bemonsteringsmethode gebruikt en ervoor zorgt dat uw steekproef groot genoeg is, moet u het volgende in gedachten houden:

  • Er zal altijd sprake zijn van een steekproeffout . De steekproef zal nooit perfect representatief zijn voor de populatie als geheel.
  • Over het algemeen geldt: hoe groter de steekproef, hoe representatiever deze is voor de populatie.
  • U moet de steekproefomvang in evenwicht brengen met variabelen uit de echte wereld, zoals tijd en kosten. Het is waarschijnlijker dat een grotere steekproef de totale populatie vertegenwoordigt, maar het verkrijgen ervan kan duurder en tijdrovender zijn.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert