Что такое анализ надежности? (определение & #038; пример)
В статистике термин надежность относится к последовательности измерений.
Если мы измеряем что-то вроде интеллекта, знаний, производительности, эффективности и т. несколько раз, мы не можем это измерить. у отдельных лиц, согласуются ли измерения?
В идеале исследователи хотят, чтобы тест был очень надежным, поскольку это означает, что он обеспечивает стабильные измерения с течением времени, а это означает, что результатам теста можно доверять.
Оказывается, есть четыре способа измерения надежности:
1. Метод разделения пополам надежности . Определяет степень ошибки в результатах теста, вызванную плохой структурой теста, например плохо сформулированными вопросами или запутанными инструкциями.
Этот метод использует следующий процесс:
- Разделите тест на две половины. Например, одна половина может состоять из четных вопросов, а другая половина – из нечетных вопросов.
- Вручайте каждую половину одному и тому же лицу.
- Повторите для большой группы людей.
- Вычислите соотношение между счетами двух таймов.
Чем выше корреляция между двумя половинами, тем выше внутренняя согласованность теста или опроса. В идеале желательно, чтобы корреляция между половинами была высокой, поскольку это указывает на то, что все части теста в равной степени вносят вклад в измеряемый результат.
2. Метод надежности повторного теста – определяет степень ошибки в результатах теста из-за административных проблем – например, шумной среды, плохого освещения, недостаточного времени для завершения теста.
Этот метод использует следующий процесс:
- Проведите тест для группы людей.
- Подождите определенное время (дни, недели или месяцы) и проведите тот же тест той же группе людей.
- Рассчитайте корреляцию между оценками двух тестов.
Как правило, корреляция надежности между тестами и повторными тестами не менее 0,80 или выше указывает на хорошую надежность.
3. Метод надежности параллельных форм – определяет степень ошибки в результатах теста, вызванную посторонними эффектами – например, учащимися, имеющими доступ к вопросам заранее, или учащимися, получающими более высокие баллы в «s», что просто приводит к большему количеству.
Этот метод использует следующий процесс:
- Проведите одну версию теста для группы людей.
- Проведите альтернативную, но столь же сложную версию теста той же группе людей.
- Рассчитайте корреляцию между оценками двух тестов.
4. Метод межэкспертной надежности – определяет, насколько последовательно каждый элемент теста измеряет истинную измеряемую конструкцию – например, все ли вопросы четко сформулированы и относятся к измеряемой конструкции?
Этот метод предполагает, что несколько обученных оценщиков или судей оценивают каждый пункт теста, а затем рассчитывают общий процент согласия между оценщиками или судьями.
Чем выше процент согласия между судьями, тем выше надежность теста.
Надежность против валидности
Надежность относится к последовательности меры, а валидность относится к степени, в которой тест или шкала измеряют конструкцию, для измерения которой он предназначен.
Хороший тест или шкала — это тот, который обладает высокой надежностью и валидностью. Однако тест или шкала могут быть надежными, но не действительными.
Например, предположим, что данные весы, которые взвешивают коробки, постоянно весят на 10 фунтов больше, чем их фактический вес. Эти весы надежны, поскольку их измерения последовательны, но они недействительны, поскольку не измеряют истинное значение веса.
Надежность и стандартная ошибка измерения
Коэффициент надежности также можно использовать для расчета стандартной ошибки измерения , которая оценивает отклонение от «истинного» балла для человека при проведении повторных измерений.
Он рассчитывается следующим образом:
SE m = s√ 1-R
Золото:
- s: стандартное отклонение измерений
- A: Коэффициент надежности теста
Обратитесь к этой статье для подробного объяснения стандартной ошибки измерения.