De spearman-brown-formule: definitie en voorbeeld
De Spearman-Brown-formule wordt gebruikt om de betrouwbaarheid van een test te voorspellen na het wijzigen van de testduur.
De formule is:
Voorspelde betrouwbaarheid = kr / (1 + (k-1)r)
Goud:
- k : Factor waarmee de testduur wordt gewijzigd. Als de oorspronkelijke toets bijvoorbeeld 10 vragen heeft en de nieuwe toets 15 vragen, is k = 15/10 = 1,5 .
- r : Betrouwbaarheid van de originele test. Meestal gebruiken we hiervoor Cronbach’s Alpha , een waarde tussen 0 en 1, waarbij hogere waarden een hogere betrouwbaarheid aangeven.
Het volgende voorbeeld laat zien hoe u deze formule in de praktijk kunt gebruiken.
Voorbeeld: hoe u de Spearman-Brown-formule gebruikt
Stel dat een bedrijf een test met 15 items gebruikt om de medewerkerstevredenheid te beoordelen en het is bekend dat de test een betrouwbaarheid van 0,74 heeft.
Als het bedrijf de lengte van de test vergroot tot 30 items, wat is dan de voorspelde betrouwbaarheid van de nieuwe test?
We kunnen de Spearman-Brown-formule gebruiken om de voorspelde betrouwbaarheid te berekenen:
- Voorspelde betrouwbaarheid = kr / (1 + (k-1)r)
- Voorspelde betrouwbaarheid = 2*.74 / (1 + (2-1)*.74)
- Voorspelde betrouwbaarheid = 0,85
De nieuwe test heeft een voorspelde betrouwbaarheid van 0,85 .
Opmerking : we hebben k berekend als 30/15 = 2.
Voorzorgsmaatregelen met betrekking tot het gebruik van de Spearman-Brown-formule
Op basis van de Spearman-Brown-formule kunnen we zien dat het verhogen van het aantal items op een test met een willekeurig getal de voorspelde betrouwbaarheid van de test zal vergroten.
Stel dat we in het vorige voorbeeld het aantal testitems verhogen van 15 naar 16. We berekenen dan k als 16/15 = 1,067.
De voorspelde betrouwbaarheid zou zijn:
- Voorspelde betrouwbaarheid = kr / (1 + (k-1)r)
- Voorspelde betrouwbaarheid = 1,067*.74 / (1 + (1.067-1)*.74)
- Voorspelde betrouwbaarheid = 0,752
De nieuwe test heeft een voorspelde betrouwbaarheid van 0,752 , wat hoger is dan de betrouwbaarheid van de oorspronkelijke test van 0,74 .
Als we deze logica gebruiken, zouden we kunnen denken dat het verlengen van de testduur met een groot aantal items een goed idee is, omdat we de betrouwbaarheid steeds dichter bij 1 kunnen brengen.
We moeten echter het volgende in gedachten houden:
1. Het gebruik van te veel items kan vermoeidheidseffecten veroorzaken.
Als een toets te veel vragen bevat, kunnen personen moe worden naarmate ze steeds meer vragen beantwoorden, waardoor ze naarmate de toets vordert minder betrouwbare antwoorden kunnen geven.
2. Nieuwe items die aan de toets worden toegevoegd, moeten dezelfde moeilijkheidsgraad hebben als bestaande items.
Het is belangrijk dat als we besluiten de lengte van een toets te verlengen, we ervoor zorgen dat de nieuwe items/vragen die we toevoegen dezelfde moeilijkheidsgraad hebben als de bestaande items, anders zal de voorspelde betrouwbaarheid niet nauwkeurig zijn.
Aanvullende bronnen
In de volgende tutorials worden andere veelgebruikte termen in de statistiek uitgelegd:
Wat is interne consistentie?
Wat is betrouwbaarheid in tweeën gedeeld?
Wat is test-hertestbetrouwbaarheid?
Wat is de betrouwbaarheid van parallelle vormen?