Undercount bias: uitleg en voorbeelden
Undercount bias is de bias die optreedt wanneer sommige leden van een populatie niet voldoende vertegenwoordigd zijn in de steekproef.
Dit soort vertekening komt vaak voor bij gemakssteekproeven en vrijwillige responssteekproeven , waarbij u een steekproef verzamelt die gemakkelijk te verkrijgen is, maar waarbij sommige leden van een populatie vaak te weinig worden geteld.
Waarom is ondertellingsbias een probleem?
Undercount bias is een probleem omdat het ervoor zorgt dat de steekproef niet representatief is voor de populatie. Het doel van het verzamelen van gegevens voor een steekproef is om gegevens op een snellere en eenvoudigere manier te verkrijgen dan het verzamelen van gegevens voor een hele populatie, en om de resultaten van de steekproef te kunnen extrapoleren naar de grotere populatie. breed.
Om de resultaten te kunnen extrapoleren, moet de steekproef echter representatief zijn voor onze populatie als geheel. Idealiter zouden we willen dat onze steekproef een ‘miniversie’ van de populatie is. Helaas kan de ondertellingsbias ervoor zorgen dat mensen in onze steekproef er heel anders uitzien dan die in de bredere populatie.
Stel bijvoorbeeld dat onderzoekers willen weten hoe burgers van een bepaalde stad denken over een mogelijke nieuwe wet. Om gegevens te verzamelen, gaan ze naar een nabijgelegen bibliotheek en vragen bezoekers wat ze van de mogelijke nieuwe wet vinden. Hoewel dit een handige manier is om gegevens te verzamelen, lopen onderzoekers het risico verschillende soorten mensen te onderschatten, waaronder:
- Mensen die thuis opgesloten zitten
- Mensen die gewoon niet graag naar de bibliotheek gaan
- Mensen die naar een andere bibliotheek gaan in een ander deel van de stad
Omdat dit onderzoek bepaalde typen mensen uitsluit, is het onwaarschijnlijk dat de onderzoeksresultaten representatief zijn voor de bevolking.
Stel bijvoorbeeld dat mensen die deze specifieke bibliotheek bezoeken veel vaker de potentiële nieuwe wet zullen steunen dan de rest van de bevolking. Dit betekent dat wanneer de resultaten van het onderzoek bekend zijn, zal blijken dat een hoog percentage van de burgers in deze stad de potentiële nieuwe wet steunt, terwijl in werkelijkheid de meeste burgers dat niet zijn.
De onderstaande afbeelding illustreert dit probleem: stel dat de groene cirkels mensen vertegenwoordigen die vóór de nieuwe wet zijn, terwijl de rode cirkels mensen vertegenwoordigen die tegen de nieuwe wet zijn:
Merk op dat de meeste mensen die vóór de nieuwe wet zijn in de steekproef zijn opgenomen, maar dat deze niet representatief is voor de bevolking als geheel. Uit de onderzoeksresultaten blijkt dat de meeste mensen voorstander zijn van de nieuwe wet, terwijl dit in werkelijkheid niet waar is.
Voorbeelden van onderschattingsbias
De volgende voorbeelden illustreren verschillende gevallen waarin ondertellingsbias kan optreden.
voorbeeld 1
Onderzoekers willen weten hoe burgers van een bepaalde stad denken over de aanleg van een nieuw park. Om gegevens te verzamelen, wonen onderzoekers een plaatselijke stadsbijeenkomst bij en vragen bewoners naar hun mening. Helaas kan deze vorm van gemakssteekproef leiden tot onderschatting van de volgende groepen:
- Mensen die geen toegang hebben tot vervoer om naar gemeentelijke bijeenkomsten te komen
- Mensen die niet eens weten dat er stadsbijeenkomsten plaatsvinden
- Mensen die ’s avonds werken en simpelweg geen gemeentevergaderingen kunnen bijwonen
Daarom wordt er geen rekening gehouden met de mening van deze mensen in de resultaten van het onderzoek. Vanwege de ondertelling van deze specifieke groepen is het onwaarschijnlijk dat de steekproef representatief is voor de populatie als geheel.
Voorbeeld 2
Onderzoekers willen weten hoeveel uur per dag mensen in een bepaald land televisie kijken. Om gegevens voor het onderzoek te verzamelen, kiezen ze willekeurig namen uit een lokaal telefoonboek en bellen mensen om hen te vragen naar hun televisiegebruik. Dit is een vorm van gemakssteekproef en kan leiden tot ondertelling van de volgende groepen:
- Zeer rijke mensen die hun telefoonnummers niet in lokale telefoongidsen vermelden
- Jongeren die alleen mobiele telefoons gebruiken en wier nummers niet in lokale telefoongidsen staan
De hoeveelheid televisie die door zeer rijke mensen en jongeren wordt bekeken, zal in dit onderzoek dus worden onderschat. Vanwege de ondertelling van deze specifieke groepen is het onwaarschijnlijk dat de steekproef representatief is voor de populatie als geheel.
Voorbeeld 3
Onderzoekers willen weten wat burgers van een bepaalde stad vinden van een nieuwe verkeerscode. Daarom verspreiden ze een vragenlijst onder mensen die langs een plaatselijk winkelcentrum komen. Dit is een vorm van gemakssteekproef die mogelijk te lijden heeft onder de onderdekking van de volgende groepen:
- Mensen die geen toegang hebben tot vervoer om naar het winkelcentrum te komen (en dus grotendeels geen last hebben van de wegcode)
- Mensen die niet graag naar het winkelcentrum gaan (en er daarom voor kiezen om niet in drukke gebieden te rijden)
- Mensen die naar een ander winkelcentrum in een andere stad gaan
Daarom wordt er geen rekening gehouden met de mening van deze mensen in de resultaten van het onderzoek. Vanwege de ondertelling van deze specifieke groepen is het onwaarschijnlijk dat de steekproef representatief is voor de populatie als geheel.
Hoe u ondertellingsbias kunt voorkomen
Undercount bias is vaak het gevolg van gemakssteekproeven. Om de effecten van ondertellingsbias te elimineren (of op zijn minst te minimaliseren), is het gebruik van een eenvoudige willekeurige steekproef een betere vorm van steekproeftrekking.
Bij dit type steekproef heeft elk lid van een populatie een gelijke kans om geselecteerd te worden om deel uit te maken van de steekproef.
Het voordeel van deze aanpak is dat eenvoudige willekeurige steekproeven over het algemeen representatief zijn voor de populatie van interesse, aangezien elk lid een gelijke kans heeft om in de steekproef te worden opgenomen.
Wanneer we deze aanpak gebruiken in plaats van gemakssteekproeven, kunnen we meer vertrouwen hebben in ons vermogen om de steekproefresultaten te extrapoleren naar de bredere populatie, omdat het waarschijnlijk is dat leden van elke (of bijna elke) groep van de bevolking in de steekproef zijn opgenomen. . .
Aanvullende bronnen
Wat is zelfselectiebias?
Wat is SEO-bias?
Wat is non-respons bias?