Verborgen variabelen: definitie en voorbeelden
Een verborgen variabele is een variabele die niet wordt opgenomen in een statistische analyse, maar wel invloed heeft op de relatie tussen twee variabelen binnen de analyse.
Een verborgen variabele kan de ware relatie tussen variabelen verbergen of ten onrechte de indruk wekken dat er een relatie tussen variabelen bestaat. In wezen kunnen verborgen variabelen de resultaten van een onderzoek misleidend maken.
Bij observationeel onderzoek is het belangrijk om te beseffen dat verborgen variabelen kunnen leiden tot ongebruikelijke interpretaties van de gegevens en relaties tussen variabelen. Bij experimentele onderzoeken is het belangrijk om het experiment zo te ontwerpen dat het risico op verborgen variabelen (zoveel mogelijk) wordt geëlimineerd.
Voorbeelden van verborgen variabelen
De volgende voorbeelden illustreren verschillende gevallen waarin verborgen variabelen aanwezig kunnen zijn in een onderzoek:
voorbeeld 1
Onderzoeker constateert dat de verkoop van ijs en aanvallen van haaien sterk positief gecorreleerd zijn. Betekent dit dat de toegenomen verkoop van ijs meer haaienaanvallen veroorzaakt?
Het is onwaarschijnlijk. De meest waarschijnlijke oorzaak is het op de loer liggend wisselvallig weer . Als het buiten warmer is, kopen meer mensen ijs en gaan meer mensen naar de oceaan.
Voorbeeld 2
Een onderzoeker ontdekt dat de consumptie van popcorn en het aantal verkeersongevallen door de jaren heen sterk met elkaar samenhangen. Betekent dit dat een hogere consumptie van popcorn meer verkeersongelukken veroorzaakt?
Het is onwaarschijnlijk. De meest waarschijnlijke oorzaak is de variabele loerende populatie . Naarmate de bevolking toeneemt, neemt de hoeveelheid geconsumeerde popcorn en het aantal verkeersongelukken toe.
Voorbeeld 3
Uit onderzoek blijkt dat hoe meer vrijwilligers zich melden na een natuurramp, hoe groter de schade is. Betekent dit dat vrijwilligers meer schade aanrichten?
Het is onwaarschijnlijk. De meest waarschijnlijke oorzaak is de wisselende omvang van de natuurramp . Een grotere natuurramp resulteert in meer vrijwilligers en een toename van de schade veroorzaakt door de natuurramp.
Voorbeeld 4
Uit onderzoek blijkt dat de verkoop van handschoenen en snowboardongevallen sterk gecorreleerd zijn. Betekent dit dat handschoenen meer snowboardongelukken veroorzaken?
Het is onwaarschijnlijk. De meest waarschijnlijke oorzaak is de op de loer liggende variabele temperatuur . Naarmate de temperatuur daalt, kopen steeds meer mensen handschoenen en gaan steeds meer mensen snowboarden.
Hoe verborgen variabelen te identificeren
Om verborgen variabelen bloot te leggen, helpt het om expertise te hebben op het gebied dat wordt bestudeerd. Door te weten welke potentiële variabelen de relatie tussen onderzoeksvariabelen die niet expliciet in het onderzoek zijn opgenomen, kunnen beïnvloeden, kunt u mogelijk verborgen variabelen blootleggen.
Een andere manier om potentiële verborgen variabelen te identificeren, is door restplots te onderzoeken. Als er een trend (lineair of niet-lineair) in de residuen zit, kan dit betekenen dat een verborgen variabele die niet in het onderzoek is opgenomen, op de een of andere manier invloed heeft op de onderzoeksvariabelen.
Hoe u het risico van verborgen variabelen kunt elimineren
In observationeel onderzoek kan het erg moeilijk zijn om het risico van verborgen variabelen uit te sluiten. In de meeste gevallen kunt u het beste eenvoudigweg potentiële verborgen variabelen identificeren, in plaats van deze te voorkomen, die van invloed kunnen zijn op het onderzoek.
In experimentele onderzoeken kan de impact van verborgen variabelen echter grotendeels worden geëlimineerd door een goed experimenteel ontwerp.
Laten we bijvoorbeeld zeggen dat we willen weten of twee pillen een verschillende invloed hebben op de bloeddruk. We weten dat verborgen variabelen zoals voeding en rookgewoonten ook van invloed zijn op de bloeddruk. We kunnen daarom proberen deze verborgen variabelen te controleren met behulp van een gerandomiseerd ontwerp . Dit betekent dat we patiënten willekeurig toewijzen aan het nemen van de eerste of de tweede pil.
Omdat we patiënten willekeurig aan groepen toewijzen, kunnen we ervan uitgaan dat de verborgen variabelen beide groepen ongeveer hetzelfde zullen beïnvloeden. Dit betekent dat elk verschil in bloeddruk kan worden toegeschreven aan de pil en niet aan het effect van een verborgen variabele.