Derde variabele probleem: definitie en voorbeeld
In de statistiek doet zich een derde variabelenprobleem voor wanneer een waargenomen correlatie tussen twee variabelen feitelijk kan worden verklaard door een derde variabele waarmee geen rekening is gehouden.
Wanneer deze derde variabele niet in aanmerking wordt genomen, kan de correlatie tussen de twee onderzochte variabelen misleidend zijn of zelfs tot verwarring leiden.
Deze tutorial biedt verschillende voorbeelden van problemen met derde variabelen in verschillende contexten.
Voorbeeld 1: Honden en brandkranen
Eén onderzoeker merkt op dat steden met meer brandkranen doorgaans ook meer honden hebben.
Deze twee variabelen zijn echter alleen gecorreleerd omdat ze allebei een sterke correlatie hebben met een derde variabele: populatiegrootte .
Grotere steden hebben doorgaans zowel meer brandkranen als meer honden. Omgekeerd hebben kleinere steden doorgaans minder brandkranen en minder honden.
Voorbeeld 2: IJsverkoop en aanvallen van haaien
Onderzoeker constateert dat de verkoop van ijs en aanvallen van haaien sterk positief gecorreleerd zijn.
Deze twee variabelen zijn echter alleen gecorreleerd omdat ze allebei een sterke correlatie hebben met een derde variabele: temperatuur .
Als het warmer is, kopen meer mensen ijs en zwemmen meer mensen in de oceaan, wat verklaart waarom de waarden van de ijsverkoop en de aanvallen van haaien in dezelfde tijd van het jaar stijgen.
Voorbeeld 3: Vrijwilligers en natuurrampen
Uit onderzoek blijkt dat hoe meer vrijwilligers zich melden na een natuurramp, hoe groter de schade is.
Deze twee variabelen zijn echter alleen gecorreleerd omdat ze allebei een sterke correlatie hebben met een derde variabele: de omvang van de natuurramp .
Grotere natuurrampen zijn sterk gecorreleerd met meer veroorzaakte schade en een toename van het aantal vrijwilligers.
gerelateerde artikelen
Wat is weggelaten variabele bias?
Wat is ondertellingsbias?
Wat is aggregatiebias?
Wat is een verwarrende variabele?