Correlatie impliceert geen oorzakelijk verband: 5 concrete voorbeelden
De uitdrukking ‚ correlatie impliceert geen oorzakelijk verband ‚ wordt in de statistiek vaak gebruikt om te benadrukken dat correlatie tussen twee variabelen niet noodzakelijkerwijs betekent dat de ene variabele de andere veroorzaakt.
Om deze uitdrukking beter te begrijpen, kunnen we de volgende concrete voorbeelden overwegen.
Voorbeeld 1: IJsverkoop en aanvallen van haaien
Als we elk jaar gegevens zouden verzamelen over de maandelijkse verkoop van ijs en de maandelijkse aanvallen van haaien in de Verenigde Staten, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Betekent dit dat het eten van ijs haaienaanvallen veroorzaakt?
Niet genoeg. De meest waarschijnlijke verklaring is dat meer mensen ijs consumeren en in de oceaan zwemmen als het buiten warmer is, wat verklaart waarom deze twee variabelen zo sterk met elkaar gecorreleerd zijn.
Hoewel de verkoop van ijs en aanvallen van haaien nauw met elkaar samenhangen, is het één niet het gevolg van het ander.
Voorbeeld 2: Masteries en Box Office-inkomsten
Als we gegevens verzamelen over het totale aantal masterdiploma’s dat jaarlijks door universiteiten wordt uitgereikt en de totale box office-inkomsten die per jaar worden gegenereerd, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Betekent dit dat het uitgeven van meer masterdiploma’s jaarlijks leidt tot een stijging van de box office-inkomsten?
Niet genoeg. De meest waarschijnlijke verklaring is dat de wereldbevolking elk jaar toeneemt, wat betekent dat er elk jaar meer masterdiploma’s worden uitgereikt en dat het aantal mensen dat jaarlijks naar de film gaat in ongeveer gelijke verhoudingen toeneemt.
Hoewel deze twee variabelen met elkaar gecorreleerd zijn, veroorzaakt de een de ander niet.
Voorbeeld 3: verdrinkingen in zwembaden in relatie tot de productie van kernenergie
Als we gegevens zouden verzamelen over het totale aantal zwembadverdrinkingen per jaar en de totale hoeveelheid energie die elk jaar door kerncentrales wordt geproduceerd, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Betekent dit dat het toenemende aantal verdrinkingen in zwembaden op de een of andere manier leidt tot een grotere productie van kernenergie?
Niet precies. De meest waarschijnlijke verklaring is dat de wereldbevolking is toegenomen, wat betekent dat meer mensen in zwembaden verdrinken, en dat de opwekking van kernenergie elk jaar levensvatbaarder wordt, wat de reden is dat deze is toegenomen.
Hoewel deze twee variabelen sterk gecorreleerd zijn, veroorzaakt de een de ander niet.
Voorbeeld 4: Mazelengevallen in relatie tot het huwelijkscijfer
Als we elk jaar gegevens zouden verzamelen over het totale aantal gevallen van mazelen in de Verenigde Staten en het huwelijkscijfer, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Betekent dit dat minder gevallen van mazelen leiden tot lagere huwelijkscijfers?
Niet precies. In plaats daarvan zijn de twee variabelen onafhankelijk: de moderne geneeskunde leidt tot een afname van het aantal gevallen van mazelen, en er trouwen elk jaar minder mensen om verschillende redenen.
Hoewel deze twee variabelen sterk gecorreleerd zijn, veroorzaakt de een de ander niet.
Voorbeeld 5: Afgestudeerden van de middelbare school in verhouding tot de pizzaconsumptie
Als we elk jaar gegevens zouden verzamelen over het totale aantal afgestudeerden van de middelbare school en de totale pizzaconsumptie in de Verenigde Staten, zouden we ontdekken dat de twee variabelen sterk gecorreleerd zijn.
Betekent dit dat een toenemend aantal middelbare scholieren leidt tot een grotere pizzaconsumptie in de Verenigde Staten?
Niet genoeg. De meest waarschijnlijke verklaring is dat de Amerikaanse bevolking in de loop van de tijd is toegenomen, wat betekent dat het aantal mensen met een middelbareschooldiploma en de totale hoeveelheid geconsumeerde pizza toeneemt naarmate de bevolking toeneemt.
Hoewel deze twee variabelen met elkaar gecorreleerd zijn, veroorzaakt de een de ander niet.
Aanvullende bronnen
De volgende zelfstudies bieden aanvullende informatie over correlatie:
Een inleiding tot de Pearson-correlatiecoëfficiënt
Impliceert causaliteit correlatie?
Correlatie versus vereniging: wat is het verschil?
Wat wordt beschouwd als een “sterke” correlatie?
Wanneer moet je correlatie gebruiken?