5 voorbeelden van valse correlaties in het echte leven
In de statistiek verwijst een valse correlatie naar een correlatie tussen twee variabelen die puur toevallig voorkomt, zonder dat de ene variabele de andere daadwerkelijk veroorzaakt.
Dit soort correlatie is gevaarlijk omdat het soms kan suggereren dat de ene variabele de andere veroorzaakt, terwijl de correlatie in werkelijkheid louter op toeval berust.
Het blijkt dat dit soort correlaties tussen variabelen in het echte leven voortdurend voorkomen.
De volgende voorbeelden delen vijf verschillende praktijkvoorbeelden van valse correlatie.
Voorbeeld 1: Masteries en Box Office-inkomsten
Als we gegevens verzamelen over het totale aantal masterdiploma’s dat jaarlijks door universiteiten wordt uitgereikt en de totale box office-inkomsten die per jaar worden gegenereerd, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Dit betekent niet dat het uitgeven van meer masterdiploma’s elk jaar tot hogere box office-inkomsten leidt.
De meest waarschijnlijke verklaring is dat de wereldbevolking elk jaar toeneemt, wat betekent dat er elk jaar meer masterdiploma’s worden uitgereikt en dat het aantal mensen dat jaarlijks naar de film gaat in ongeveer gelijke verhoudingen toeneemt.
De correlatie tussen de twee variabelen is vals.
Voorbeeld 2: Mazelengevallen in relatie tot het huwelijkscijfer
Als we elk jaar gegevens zouden verzamelen over het totale aantal gevallen van mazelen in de Verenigde Staten en het huwelijkscijfer, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Dit betekent niet dat het terugdringen van het aantal gevallen van mazelen op de een of andere manier tot lagere huwelijkscijfers leidt. De twee variabelen zijn onafhankelijk.
De moderne geneeskunde zorgt er simpelweg voor dat het aantal gevallen van mazelen afneemt en dat er om verschillende redenen elk jaar minder mensen trouwen.
De correlatie tussen de twee variabelen is vals.
Voorbeeld 3: Afgestudeerden van de middelbare school in verhouding tot de donutconsumptie
Als we elk jaar gegevens zouden verzamelen over het totale aantal afgestudeerden van de middelbare school en de totale donutconsumptie in de Verenigde Staten, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Dit betekent niet dat de toename van het aantal afgestudeerden van de middelbare school leidt tot een grotere donutconsumptie in de Verenigde Staten.
De meest waarschijnlijke verklaring is dat de Amerikaanse bevolking in de loop van de tijd is toegenomen, wat betekent dat het aantal mensen met een middelbareschooldiploma en het totale aantal geconsumeerde donuts toeneemt naarmate de bevolking toeneemt.
Dit is een valse correlatie.
Voorbeeld 4: De verkoop van videogames versus de productie van kernenergie
Als we gegevens zouden verzamelen over de totale jaarlijkse verkoop van videogames wereldwijd en de totale energieproductie door kerncentrales, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Dit betekent niet dat de toegenomen verkoop van videogames leidt tot een grotere productie van kernenergie.
In plaats daarvan worden er meer kerncentrales gebouwd en worden er meer videogames verkocht naarmate de wereldbevolking elk jaar toeneemt.
Hoewel beide variabelen in de loop van de tijd voortdurend toenemen, is de een niet de oorzaak van de ander. De correlatie tussen de twee is vals.
Voorbeeld 5: Arcade-inkomsten vs. Kolenmijn banen
Als we gegevens verzamelen over de totale inkomsten gegenereerd door speelhallen in de Verenigde Staten en het totale aantal banen in de steenkoolmijnbouw in de Verenigde Staten, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Dit betekent niet dat de ene variabele ervoor zorgt dat de andere afneemt.
In plaats daarvan zijn arcades en kolenmijnen in de loop der jaren minder gebruikelijk geworden, wat verklaart waarom beide variabelen in ongeveer hetzelfde tempo zijn afgenomen.
De correlatie tussen de twee variabelen is vals.
Aanvullende bronnen
De volgende tutorials bieden praktijkvoorbeelden van andere statistische concepten:
Voorbeelden van het gebruik van waarschijnlijkheid in het echte leven
Voorbeelden van het gebruik van correlatie in het echte leven
Voorbeelden van het gebruik van gemiddelde, mediaan en modus in het echte leven