Что такое ретестовая надежность? (определение & #038; пример)


Исследователи часто хотят использовать тот или иной тип теста для измерения таких понятий, как интеллект, способности, образовательные способности и т. д. у особей определенной популяции.

При проведении любого типа теста важно, чтобы тест был надежным . Другими словами, важно, чтобы результаты теста можно было воспроизвести в одних и тех же условиях в два разных момента времени.

Надежность повторного тестирования — это особый способ измерения надежности теста, который характеризует степень, в которой тест дает схожие результаты с течением времени.

Мы рассчитываем надежность повторного тестирования, используя коэффициент корреляции Пирсона , который принимает значение от -1 до 1, где:

  • -1 указывает на совершенно отрицательную линейную корреляцию между двумя оценками.
  • 0 указывает на отсутствие линейной корреляции между двумя оценками.
  • 1 указывает на совершенно положительную линейную корреляцию между двумя оценками.

Например, мы могли бы провести IQ-тест 50 участников 1 января, а затем провести тот же тип IQ-теста аналогичной сложности для той же группы из 50 участников месяцем позже.

Мы могли бы рассчитать корреляцию результатов между двумя тестами, чтобы определить, имеет ли тест хорошую надежность при повторном тестировании.

Тест-ретест надежности

Как правило, корреляция надежности между тестами и повторными тестами не менее 0,80 или выше указывает на хорошую надежность.

Пример: расчет надежности повторного тестирования

Предположим, исследователи проводят тест 20 человек, а через месяц проводят такой же тест тем же 20 людям.

Их баллы показаны ниже:

Пример расчета надежности повторного тестирования

Мы можем использовать калькулятор корреляции и определить, что коэффициент корреляции Пирсона между двумя наборами оценок равен 0,836 .

Поскольку эта корреляция превышает 0,80, исследователи могут сделать вывод, что тест имеет хорошую надежность при повторном тестировании.

Другими словами, тест дает надежные результаты, которые можно воспроизвести в разное время.

Потенциальная погрешность в надежности повторного тестирования

Надежность повторного тестирования является полезной мерой для расчета, но следует учитывать следующие потенциальные отклонения, которые могут повлиять на этот показатель:

1. Практический эффект

Эффект практики возникает, когда участники просто улучшают результаты теста посредством практики. Это означает, что они, скорее всего, будут лучше справляться с последующими тестами, поскольку у них было время попрактиковаться и совершенствоваться.

Чтобы избежать предвзятости такого типа, нужно давать участникам тесты одинаковой сложности, но с разным набором вопросов, чтобы они не могли запомнить ответы на те типы вопросов, которые задавались в первом тесте.

2. Эффект усталости

Эффект усталости возникает, когда состояние участников при выполнении определенных тестов ухудшается из-за их умственного истощения или усталости после прохождения предыдущих тестов.

Чтобы избежать предвзятости такого типа, нужно выделять достаточно времени между тестами (в идеале недели или даже месяцы), чтобы участники были свежи, когда пройдут оба теста.

3. Различия в условиях

Когда участники проходят два теста в разных условиях (т. е. разное освещение, разное время суток, разное время для выполнения теста и т. д.), вполне возможно, что они получат более низкие результаты разных тестов просто из-за различий в среде тестирования.

Чтобы избежать такого рода предвзятости, необходимо обеспечить, чтобы участники проходили оба теста в одинаковых условиях, т. е. в одно и то же время суток, при одинаковом общем освещении и в одной и той же среде, и имели одинаковое время для завершения теста.

Дополнительные ресурсы

Краткое введение в анализ надежности
Что такое надежность, разделенная пополам?
Что такое надежность между экспертами?
Что такое надежность параллельных форм?
Что такое стандартная ошибка измерения?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *