Evenwichtige of onevenwichtige ontwerpen: wat is het verschil?
In de statistiek worden ANOVA-modellen (‘variantieanalyse’) gebruikt om te bepalen of de gemiddelden van verschillende behandelingsniveaus al dan niet gelijk zijn.
Een ANOVA heeft een gebalanceerd ontwerp als de steekproefomvang voor alle behandelcombinaties gelijk is.
Omgekeerd heeft een ANOVA een onevenwichtig ontwerp als de steekproefomvang niet voor alle behandelingscombinaties gelijk is .
Laten we bijvoorbeeld zeggen dat we een one-way ANOVA willen uitvoeren om te bepalen of drie verschillende meststoffen dezelfde gemiddelde plantengroei veroorzaken.
De volgende grafiek toont een voorbeeld van een gebalanceerd en onevenwichtig ontwerp voor deze eenrichtings-ANOVA:
In het uitgebalanceerde ontwerp zijn er bij elke behandeling evenveel planten aanwezig. Bij een onevenwichtig ontwerp zijn de steekproefomvang ongelijk.
Of stel dat we een tweerichtings-ANOVA willen uitvoeren om te bepalen of verschillende combinaties van kunstmest en zonlicht dezelfde gemiddelde plantengroei veroorzaken.
De volgende grafiek toont een voorbeeld van een gebalanceerd en onevenwichtig ontwerp voor deze tweeweg-ANOVA:
Gerelateerd: Enkele reis vs. Tweerichtings-ANOVA: wanneer moet u ze gebruiken?
Waarom verdient een gebalanceerd ontwerp de voorkeur?
Evenwichtige ontwerpen bieden de volgende voordelen ten opzichte van onevenwichtige ontwerpen:
1. De kracht van een ANOVA is het grootst wanneer de steekproefomvang voor alle behandelcombinaties gelijk is. Wanneer de power het hoogst is, hebben we de beste kans om verschillen in gemiddelden tussen behandelingscombinaties te detecteren, terwijl de gemiddelden feitelijk verschillend zijn.
2. De algehele F-statistiek van ANOVA is minder gevoelig voor schendingen van de aanname van gelijkheid van variantie .
Hoe ontstaan onevenwichtige ontwerpen?
Hoewel onderzoekers proberen een evenwichtig ontwerp voor een ANOVA op te stellen, zijn er verschillende redenen waarom een onevenwichtig ontwerp kan optreden, waaronder:
- Individuen kunnen halverwege besluiten om zich terug te trekken uit een onderzoek
- Planten kunnen tijdens het onderzoek eenvoudigweg doodgaan
- Het kan zijn dat een fabriek zijn deuren sluit en bepaalde onderdelen die nodig zijn voor een onderzoek niet kan leveren.
Er zijn veel redenen waarom een ervaring plotseling uit balans kan raken.
Hoe om te gaan met onevenwichtige ontwerpen
Zoals eerder vermeld, wordt de voorkeur gegeven aan gebalanceerde ontwerpen omdat deze een grotere statistische kracht en betrouwbaardere teststatistieken bieden.
Als u echter een experiment moet uitvoeren met een onevenwichtig ontwerp, heeft u drie keuzes:
1. Doe toch een ANOVA.
Als de steekproefgroottes in de behandelcombinaties niet gelijk zijn, maar wel aan de aanname van gelijke varianties wordt voldaan, kunt u toch een ANOVA uitvoeren.
Het is bekend dat ANOVA’s behoorlijk robuust zijn bij ongelijke steekproefgroottes als de varianties tussen elke combinatie van behandelingen altijd gelijk zijn.
2. Vul ontbrekende waarden toe.
Als er slechts kleine verschillen zijn in de steekproefomvang tussen behandelingscombinaties, kunt u de ontbrekende waarden toeschrijven aan de hand van het gemiddelde of de mediaan van de behandelingsniveaus.
Deze aanpak moet echter met voorzichtigheid worden gebruikt en mag alleen worden gebruikt als de steekproefomvang in het begin vrijwel gelijk is.
3. Voer een niet-parametrische test uit.
Als de steekproefomvang niet gelijk is en er niet aan de aanname van gelijkheid van varianties wordt voldaan, kunt u in plaats daarvan een niet-parametrisch equivalent van een ANOVA uitvoeren, zoals de Kruskal-Wallis-test .
Dit type test is veel robuuster bij ongelijke steekproefgroottes en ongelijke varianties tussen behandelingscombinaties.