Що таке тест-повторна надійність? (визначення & #038; приклад)


Дослідники часто хочуть використовувати певний тип тесту для вимірювання таких понять, як інтелект, здібності, навчальні здібності тощо. в особин певної популяції.

При проведенні будь-якого типу тесту важливо, щоб тест був надійним . Іншими словами, важливо, щоб результати тесту можна було відтворити за однакових умов у два різні моменти часу.

Надійність тесту-повторного тесту — це специфічний спосіб вимірювання надійності тесту, який стосується ступеня, до якого тест дає схожі результати з часом.

Ми розраховуємо надійність тесту-повторного тесту за допомогою коефіцієнта кореляції Пірсона , який приймає значення від -1 до 1, де:

  • -1 вказує на абсолютно негативну лінійну кореляцію між двома оцінками
  • 0 означає відсутність лінійної кореляції між двома оцінками
  • 1 вказує на абсолютно позитивну лінійну кореляцію між двома оцінками

Наприклад, ми можемо провести IQ-тест для 50 учасників 1 січня, а потім дати той самий тип IQ-тесту подібної складності тій самій групі з 50 учасників через місяць.

Ми могли б обчислити кореляцію балів між двома тестами, щоб визначити, чи тест має хорошу надійність тестування.

Тест-перетест надійності

Як правило, кореляція надійності тесту-повторного тестування принаймні 0,80 або вище вказує на хорошу надійність.

Приклад: розрахунок надійності тест-повторний тест

Припустімо, що дослідники дають тест 20 людям, а через місяць дають такий самий тест тим самим 20 людям.

Їх бали наведено нижче:

Приклад розрахунку надійності тест-ретест

Ми можемо використати кореляційний калькулятор, щоб знайти, що коефіцієнт кореляції Пірсона між двома наборами балів становить 0,836 .

Оскільки ця кореляція перевищує 0,80, дослідники можуть зробити висновок, що тест має хорошу надійність тестування.

Іншими словами, тест дає надійні результати, які можна відтворити в різний час.

Потенційне упередження в надійності тесту-повторного тесту

Надійність тесту-повторного тесту є корисним показником для обчислення, але пам’ятайте про наступні потенційні відхилення, які можуть вплинути на цей показник:

1. Практичний ефект

Практичний ефект виникає, коли учасники просто вдосконалюють тест через практику. Це означає, що вони, ймовірно, будуть кращими на наступних тестах, оскільки вони мали час для практики та вдосконалення.

Спосіб уникнути такого типу упередженості полягає в тому, щоб давати окремим тестам однакову складність, але з різною різноманітністю запитань, щоб вони не могли запам’ятати відповіді на типи запитань, заданих під час першого тесту.

2. Ефект втоми

Ефект втоми виникає, коли стан учасників погіршується під час певних тестів, оскільки вони розумово виснажені або втомлені після виконання попередніх тестів.

Спосіб уникнути такого типу упередженості полягає в тому, щоб забезпечити достатньо часу між тестами (в ідеалі тижні або навіть місяці), щоб учасники були свіжими, коли вони складатимуть обидва тести.

3. Відмінності в умовах

Коли учасники проходять два тести за різних умов (тобто різного освітлення, різного часу доби, різного часу для виконання тесту тощо), можливо, вони отримають нижчі різні результати тесту просто через відмінності в середовищі тестування.

Спосіб уникнути такого типу упередженості полягає в тому, щоб переконатися, що учасники складали обидва тести в ідентичних умовах, тобто в той самий час доби, при однаковому загальному освітленні та тому самому середовищі, і мали однаковий час для проходження тесту.

Додаткові ресурси

Короткий вступ до аналізу надійності
Що таке надійність, розділена навпіл?
Що таке міжрейтерська надійність?
Що таке надійність паралельних форм?
Що таке стандартна помилка вимірювання?

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *