Covariaat
In dit artikel wordt uitgelegd wat covariaten in de statistiek zijn. U vindt daarom de betekenis van covariaat, voorbeelden van covariaten en hoe u een statistisch model met een covariaat kunt maken.
Wat is een covariaat?
In de statistiek is een covariabele een soort variabele die de relatie tussen de onafhankelijke variabele en de afhankelijke variabele beïnvloedt, maar die niet van direct belang is. Met andere woorden: een covariaat is een variabele die de resultaten beïnvloedt, maar niet interessant is om te bestuderen.
Daarom moet een covariaat in een statistisch onderzoek onder controle worden gehouden, zodat deze de resultaten van het onderzoek niet beïnvloedt. Normaal gesproken worden covariaten meestal in het studiemodel opgenomen om hun invloed op de afhankelijke variabele te bepalen, hier komen we hieronder uitgebreider op terug.
Als u bijvoorbeeld de relatie wilt analyseren tussen de aandelenkoers van een bedrijf (afhankelijke variabele) en de bedrijfswinst (onafhankelijke variabele), zou een covariaat de aandelenmarkttrend zijn. Want zelfs als we er niet in geïnteresseerd zijn om te weten of de prijs van de overige aandelen op de aandelenmarkt stijgt of daalt, zal de prijs van de aandelen van het bestudeerde bedrijf logischerwijs variëren afhankelijk van het feit of de markt bullish of bearish is. .
Een covariabele kan soms ook een covariabele worden genoemd.
Voorbeelden van covariaten
Zodra we de definitie van een covariaat hebben gezien, zullen we verschillende voorbeelden van covariaten zien om het begrip van het concept te voltooien:
- Als je wilt analyseren hoe de hoeveelheid toegevoegde kunstmest (onafhankelijke variabele) de plantengroei beïnvloedt (afhankelijke variabele), is de tijdsduur dat de planten aan zonlicht werden blootgesteld een covariabele omdat deze de resultaten kan beïnvloeden.
- Als het doel is om de relatie te onderzoeken tussen de door studenten behaalde cijfers (afhankelijke variabele) en de uren die ze aan studeren besteden (onafhankelijke variabele), is een covariaat de docent die het curriculum uitlegt. Logischerwijs zullen de cijfers per leraar verschillen, omdat er leraren zijn die beter uitleggen dan anderen.
- Wanneer we de correlatie bestuderen tussen de productie van een fabriek (afhankelijke variabele) en het aantal machines dat de fabriek heeft (onafhankelijke variabele), is een covariaat het salaris dat werknemers ontvangen, aangezien dit hun motivatie en dus hun prestaties beïnvloedt.
Variabel en covariabel
Over het algemeen onderscheiden covariaten zich van variabelen door de interesse die ze voor hun onderzoek wekken. Met andere woorden: in een statistisch onderzoek is het niet interessant om een covariaat te bestuderen, maar eerder om het effect dat een variabele op de resultaten heeft te analyseren.
Zowel een variabele als een covariaat hebben echter invloed op de verkregen resultaten. Daarom worden beide typen variabelen doorgaans in het statistische model opgenomen. Op deze manier kan de impact van de covariabele op de respons worden gezien en kan de correlatie tussen de onafhankelijke variabele en de afhankelijke variabele goed worden geanalyseerd.
Model met covariaat
Om de correlatie tussen een afhankelijke variabele en een onafhankelijke variabele te bestuderen, wordt normaal gesproken een eenvoudig lineair regressiemodel uitgevoerd. Dit statistische model maakt het mogelijk om te bepalen of de relatie tussen twee variabelen significant is, of omgekeerd, of deze kan worden verwaarloosd.
Bij eenvoudige lineaire regressie wordt echter geen rekening gehouden met covariaten, aangezien er slechts één verklarende variabele is opgenomen. Als er dus één of meer covariabelen zijn, worden deze doorgaans in het onderzoek opgenomen, waardoor een meervoudig regressiemodel wordt uitgevoerd. Op deze manier kan de relatie van het antwoord met de verklarende variabele van belang en met de covariabelen worden geanalyseerd, aangezien deze ook de resultaten kunnen bepalen.
Dit type statistische analyse wordt covariantieanalyse (of ANCOVA) genoemd, wat vergelijkbaar is met een variantieanalyse (ANOVA), maar ook de covariaten van het onderzoek omvat.