Що таке аналіз надійності? (визначення & #038; приклад)
У статистиці термін надійність означає послідовність вимірювання.
Якщо ми вимірюємо щось на зразок інтелекту, знань, продуктивності, ефективності тощо. кілька разів, ми не можемо це виміряти. в окремих осіб, чи відповідають вимірювання?
В ідеалі дослідники хочуть, щоб тест був високонадійним, оскільки це означає, що він забезпечує послідовні вимірювання з часом, тобто результатам тесту можна довіряти.
Виявляється, існує чотири способи вимірювання надійності:
1. Метод розділеної надійності – визначає ступінь похибки в результатах тесту через погану побудову тесту, як-от неправильно сформульовані питання або заплутані інструкції.
У цьому методі використовується такий процес:
- Розділіть тест на дві половини. Наприклад, одна половина може складатися з парних запитань, а інша — з непарних.
- Віддайте кожну половину одній особі.
- Повторіть для великої групи осіб.
- Обчисліть кореляцію між результатами двох таймів.
Чим вища кореляція між двома половинами, тим вища внутрішня узгодженість тесту чи опитування. В ідеалі ви хотіли б, щоб кореляція між половинами була високою, оскільки це вказує на те, що всі частини тесту однаково впливають на те, що вимірюється.
2. Метод надійності повторного тестування – визначає ступінь похибки в результатах тесту через проблеми з адмініструванням – наприклад, шумне середовище, погане освітлення, недостатній час для завершення тесту.
У цьому методі використовується такий процес:
- Проведіть тестування для групи осіб.
- Зачекайте певний час (дні, тижні або місяці) і проведіть той самий тест тій самій групі осіб.
- Обчисліть кореляцію між балами двох тестів.
Як правило, кореляція надійності тесту-повторного тестування принаймні 0,80 або вище вказує на хорошу надійність.
3. Метод надійності паралельних форм – Визначає ступінь похибки в результатах тестування через сторонні ефекти – наприклад, учні мають доступ до запитань заздалегідь або учні отримують вищі бали, що просто призводить до більшого.
У цьому методі використовується такий процес:
- Проведіть одну версію тесту для групи осіб.
- Проведіть альтернативну, але не менш складну версію тесту для тієї ж групи осіб.
- Обчисліть кореляцію між балами двох тестів.
4. Метод надійності між оцінювачами – Визначає, наскільки послідовно кожен елемент тесту вимірює справжню вимірювану конструкцію – наприклад, чи всі запитання чітко повідомлені та мають відношення до вимірюваної конструкції?
Цей метод включає кілька навчених оцінювачів або суддів, які оцінюють кожен пункт тесту, а потім обчислюють загальний відсоток згоди між оцінювачами або суддями.
Чим вищий відсоток згоди між суддями, тим вищою є надійність тесту.
Надійність проти достовірності
Надійність відноситься до узгодженості міри, а валідність стосується ступеня, до якого тест або шкала вимірює конструкцію, яку вона призначена вимірювати.
Хороший тест або шкала – це той, який має високу надійність і валідність. Проте тест або шкала можуть бути надійними, але не дійсними.
Наприклад, припустимо, що задані ваги, які зважують ящики, постійно важать на 10 фунтів більше, ніж їхня фактична вага. Ця вага є надійною, оскільки її вимірювання послідовні, але вона недійсна, оскільки не вимірює справжнього значення ваги.
Надійність і стандартна похибка вимірювання
Коефіцієнт надійності також можна використовувати для обчислення стандартної похибки вимірювання , яка оцінює варіацію навколо «справжнього» балу для окремої людини, коли проводяться повторні вимірювання.
Він розраховується таким чином:
SE m = s√ 1-R
золото:
- s: стандартне відхилення вимірювань
- A: Коефіцієнт надійності тесту
Зверніться до цієї статті , щоб отримати детальне пояснення стандартної похибки вимірювання.