Was ist test-retest-reliabilität? (definition & #038; beispiel)
Forscher möchten häufig eine Art Test verwenden, um ein Konzept wie Intelligenz, Begabung, Bildungsfähigkeit usw. zu messen. bei Individuen einer bestimmten Population.
Bei jeder Art von Test ist es wichtig, dass der Test zuverlässig ist. Mit anderen Worten: Es ist wichtig, dass die Ergebnisse eines Tests unter denselben Bedingungen zu zwei verschiedenen Zeitpunkten reproduziert werden können.
Die Zuverlässigkeit von Testwiederholungstests ist eine spezielle Methode zur Messung der Zuverlässigkeit eines Tests und bezieht sich auf das Ausmaß, in dem ein Test im Laufe der Zeit ähnliche Ergebnisse liefert.
Wir berechnen die Test-Retest-Zuverlässigkeit mithilfe des Pearson-Korrelationskoeffizienten , der einen Wert zwischen -1 und 1 annimmt, wobei:
- -1 zeigt eine vollkommen negative lineare Korrelation zwischen zwei Bewertungen an
- 0 bedeutet, dass zwischen zwei Werten keine lineare Korrelation besteht
- 1 zeigt eine vollkommen positive lineare Korrelation zwischen zwei Bewertungen an
Beispielsweise könnten wir am 1. Januar 50 Teilnehmern einen IQ-Test geben und einen Monat später derselben Gruppe von 50 Teilnehmern denselben IQ-Test mit ähnlichem Schwierigkeitsgrad geben.
Wir könnten die Korrelation der Ergebnisse zwischen den beiden Tests berechnen, um festzustellen, ob der Test eine gute Test-Retest-Zuverlässigkeit aufweist.
Im Allgemeinen weist eine Test-Retest-Zuverlässigkeitskorrelation von mindestens 0,80 oder höher auf eine gute Zuverlässigkeit hin.
Beispiel: Berechnung der Test-Retest-Zuverlässigkeit
Angenommen, Forscher führen einen Test bei 20 Personen durch und führen dann einen Monat später denselben Testtyp bei denselben 20 Personen durch.
Ihre Punktzahlen sind unten aufgeführt:
Mithilfe eines Korrelationsrechners können wir herausfinden, dass der Pearson-Korrelationskoeffizient zwischen den beiden Bewertungssätzen 0,836 beträgt.
Da diese Korrelation größer als 0,80 ist, konnten Forscher daraus schließen, dass der Test eine gute Test-Retest-Zuverlässigkeit aufweist.
Mit anderen Worten: Der Test liefert zuverlässige Ergebnisse, die zu verschiedenen Zeitpunkten reproduziert werden können.
Potenzielle Verzerrung der Test-Retest-Zuverlässigkeit
Die Testwiederholungszuverlässigkeit ist ein nützliches Maß für die Berechnung. Beachten Sie jedoch die folgenden potenziellen Verzerrungen, die sich auf dieses Maß auswirken könnten:
1. Praktische Wirkung
Ein Übungseffekt entsteht, wenn Teilnehmer einen Test einfach durch Übung verbessern. Das bedeutet, dass sie bei nachfolgenden Tests wahrscheinlich bessere Ergebnisse erzielen, weil sie Zeit zum Üben und Verbessern hatten.
Die Möglichkeit, diese Art von Voreingenommenheit zu vermeiden, besteht darin, den einzelnen Personen Tests mit gleichem Schwierigkeitsgrad, aber mit unterschiedlichen Fragen zu geben, sodass sie sich die Antworten auf die im ersten Test gestellten Fragen nicht merken können.
2. Ermüdungseffekt
Ein Müdigkeitseffekt tritt auf, wenn sich der Zustand der Teilnehmer bei bestimmten Tests verschlechtert, weil sie nach der Teilnahme an früheren Tests geistig erschöpft oder müde sind.
Diese Art von Verzerrung lässt sich vermeiden, indem man zwischen den Tests genügend Zeit verstreichen lässt (idealerweise Wochen oder sogar Monate), damit die Teilnehmer frisch sind, wenn sie beide Tests absolvieren.
3. Unterschiede in den Bedingungen
Wenn Teilnehmer die beiden Tests unter unterschiedlichen Bedingungen absolvieren (z. B. unterschiedliche Beleuchtung, unterschiedliche Tageszeit, unterschiedliche Zeit für den Abschluss des Tests usw.), ist es möglich, dass sie einfach aufgrund der Unterschiede in der Testumgebung geringere unterschiedliche Testergebnisse erzielen.
Diese Art von Verzerrung kann vermieden werden, indem sichergestellt wird, dass die Teilnehmer beide Tests unter identischen Bedingungen absolvieren, dh zur gleichen Tageszeit, mit der gleichen allgemeinen Beleuchtung und der gleichen Umgebung, und dass sie die gleiche Zeit haben, den Test abzuschließen.
Zusätzliche Ressourcen
Eine kurze Einführung in die Zuverlässigkeitsanalyse
Was ist die halbierte Zuverlässigkeit?
Was ist Interrater-Reliabilität?
Was ist die Zuverlässigkeit paralleler Formen?
Was ist ein Standardmessfehler?