De bonferroni-correctie: definitie en voorbeeld


Wanneer u hypothesetests uitvoert, bestaat er altijd een risico op het maken van een Type I-fout. Dit is wanneer je de nulhypothese verwerpt terwijl deze feitelijk waar is.

We noemen dit soms een “vals-positief” – wanneer we beweren dat er een statistisch significant effect is, terwijl dat in werkelijkheid niet het geval is.

Wanneer we hypothesetoetsen uitvoeren, is het type I-foutpercentage gelijk aan het significantieniveau (α), dat gewoonlijk wordt gekozen op 0,01, 0,05 of 0,10. Wanneer we echter meerdere hypothesetests tegelijk uitvoeren, wordt de kans op een vals positief resultaat groter.

Wanneer we meerdere hypothesetests tegelijk uitvoeren, hebben we te maken met wat het ‘family-wise error rate’ wordt genoemd, dat wil zeggen de waarschijnlijkheid dat ten minste één van de tests een vals-positief resultaat oplevert. Dit kan als volgt worden berekend:

Foutpercentage per familie = 1 – (1-α) n

Goud:

  • α: het significantieniveau voor een enkele hypothesetest
  • n: Het totale aantal tests

Als we een enkele hypothesetest uitvoeren met α = 0,05, is de kans dat we een type I-fout maken slechts 0,05.

Foutenpercentage per familie = 1 – (1-α) c = 1 – (1-.05) 1 = 0,05

Als we twee hypothesetests tegelijk uitvoeren en voor elke test α = 0,05 gebruiken, neemt de kans dat we een Type I-fout maken toe tot 0,0975.

Foutenpercentage per familie = 1 – (1-α) c = 1 – (1-.05) 2 = 0,0975

En als we vijf hypothesetoetsen tegelijk uitvoeren met α = 0,05 voor elke toets, neemt de kans dat we een Type I-fout maken toe tot 0,2262.

Foutenpercentage per familie = 1 – (1-α) c = 1 – (1-.05) 5 = 0,2262

Het is gemakkelijk in te zien dat naarmate we het aantal statistische tests vergroten, de kans op het begaan van een Type I-fout bij ten minste één van de tests snel toeneemt.

Eén manier om dit probleem op te lossen is het gebruik van een Bonferroni-correctie.

Wat is een Bonferroni-correctie?

Een Bonferroni-correctie verwijst naar het proces van het aanpassen van het alfa(α)-niveau voor een familie van statistische tests om de waarschijnlijkheid van het maken van een Type I-fout te beheersen.

De formule voor een Bonferroni-correctie is als volgt:

α nieuw = α origineel / n

Goud:

  • originele α: het oorspronkelijke α-niveau
  • n: Het totale aantal uitgevoerde vergelijkingen of tests

Als we bijvoorbeeld drie statistische tests tegelijk uitvoeren en voor elke test α = 0,05 willen gebruiken, vertelt de Bonferroni-correctie ons dat we α new = 0,01667 moeten gebruiken.

α nieuw = α origineel / n = 0,05 / 3 = 0,01667

We moeten de nulhypothese van elke individuele test dus alleen verwerpen als de p-waarde van de test kleiner is dan 0,01667.

Bonferroni-correctie: een voorbeeld

Stel dat een hoogleraar wil weten of drie verschillende studietechnieken wel of niet tot verschillende toetsscores onder studenten leiden.

Om dit te testen, wijst ze willekeurig 30 studenten toe om elke studietechniek te gebruiken. Na een week gebruik te hebben gemaakt van de toegewezen studietechniek, legt elke student hetzelfde examen af.

Vervolgens voert ze een eenrichtings-ANOVA uit en ontdekt dat de totale p-waarde 0,0476 is. Omdat dit cijfer kleiner is dan 0,05, verwerpt ze de nulhypothese van de eenrichtings-ANOVA en concludeert ze dat niet elke studietechniek dezelfde gemiddelde examenscore oplevert.

Om erachter te komen welke onderzoekstechnieken statistisch significante scores opleveren, voert ze de volgende paarsgewijze t-toetsen uit:

  • Techniek 1 versus Techniek 2
  • Techniek 1 versus Techniek 3
  • Techniek 2 versus Techniek 3

Ze wil de kans op het begaan van een type I-fout beheersen bij α = 0,05. Omdat ze meerdere tests tegelijk uitvoert, besluit ze een Bonferroni-correctie toe te passen en α new = .01667 te gebruiken.

nieuw α = origineel α / n = 0,05 / 3 = 0,01667

Vervolgens voert ze T-tests uit voor elke groep en ontdekt het volgende:

  • Techniek 1 versus Techniek 2 | p-waarde = 0,0463
  • Techniek 1 versus Techniek 3 | p-waarde = 0,3785
  • Techniek 2 versus Techniek 3 | p-waarde = 0,0114

Omdat de p-waarde voor techniek 2 versus techniek 3 de enige p-waarde kleiner dan 0,01667 is, concludeert ze dat er alleen een statistisch significant verschil is tussen techniek 2 en techniek 3.

Aanvullende bronnen

Bonferroni-correctiecalculator
Een Bonferroni-correctie uitvoeren in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert