Jaka jest niezawodność testu-retestu? (definicja – przykład)

Przez Benjamin Anderson 26 lipca, 2023 Przewodnik 0 komentarzy

Naukowcy często chcą zastosować jakiś rodzaj testu, aby zmierzyć takie pojęcia, jak inteligencja, uzdolnienia, zdolności edukacyjne itp. u osobników określonej populacji.

Podczas przeprowadzania dowolnego rodzaju testu ważne jest, aby był on wiarygodny . Innymi słowy, ważne jest, aby wyniki testu można było odtworzyć w tych samych warunkach w dwóch różnych momentach.

Rzetelność testu-powtórnika to specyficzny sposób pomiaru wiarygodności testu, który odnosi się do stopnia, w jakim test daje podobne wyniki w czasie.

Wiarygodność test-retest obliczamy za pomocą współczynnika korelacji Pearsona , który przyjmuje wartość z zakresu od -1 do 1 gdzie:

-1 oznacza całkowicie ujemną korelację liniową pomiędzy dwoma wynikami
Wartość 0 oznacza brak liniowej korelacji pomiędzy dwoma wynikami
1 wskazuje doskonale dodatnią korelację liniową pomiędzy dwoma wynikami

Na przykład 1 stycznia moglibyśmy przeprowadzić test IQ 50 uczestników, a miesiąc później ten sam rodzaj testu IQ o podobnym stopniu trudności tej samej grupie 50 uczestników.

Moglibyśmy obliczyć korelację wyników między dwoma testami, aby określić, czy test ma dobrą niezawodność w trybie testu-powtórzenia.

Niezawodność testu-retestu

Ogólnie rzecz biorąc, korelacja wiarygodności testu-powtórnika wynosząca co najmniej 0,80 lub więcej wskazuje na dobrą niezawodność.

Przykład: obliczanie wiarygodności test-retest

Załóżmy, że badacze przeprowadzą test 20 osób, a miesiąc później ten sam test tym samym 20 osobom.

Ich wyniki przedstawiono poniżej:

Przykład obliczenia wiarygodności test-retest

Możemy użyć kalkulatora korelacji, aby stwierdzić, że współczynnik korelacji Pearsona pomiędzy dwoma zestawami wyników wynosi 0,836 .

Ponieważ korelacja ta jest większa niż 0,80, badacze mogą stwierdzić, że test charakteryzuje się dobrą wiarygodnością typu „test-retest”.

Innymi słowy, test daje wiarygodne wyniki, które można odtworzyć w różnym czasie.

Potencjalne obciążenie w wiarygodności testu-retestu

Rzetelność typu „test-powtórz test” jest przydatną miarą do obliczeń, należy jednak pamiętać o następujących potencjalnych odchyleniach, które mogą mieć wpływ na tę miarę:

1. Efekt praktyczny

Efekt praktyki występuje, gdy uczestnicy po prostu poprawiają wynik testu poprzez praktykę. Oznacza to, że prawdopodobnie osiągną lepsze wyniki w kolejnych testach, ponieważ mieli czas na ćwiczenia i doskonalenie.

Sposobem na uniknięcie tego typu uprzedzeń jest zapewnienie poszczególnym osobom testów o jednakowym stopniu trudności, ale z różnymi pytaniami, tak aby nie mogli zapamiętać odpowiedzi na rodzaje pytań zadanych w pierwszym teście.

2. Efekt zmęczenia

Efekt zmęczenia występuje, gdy stan uczestników pogarsza się w niektórych testach, ponieważ są wyczerpani psychicznie lub zmęczeni po wykonaniu poprzednich testów.

Sposobem na uniknięcie tego typu stronniczości jest zapewnienie wystarczającej ilości czasu pomiędzy testami (najlepiej tygodni lub nawet miesięcy), tak aby uczestnicy przystępując do obu testów byli świezi.

3. Różnice w warunkach

Jeżeli uczestnicy przystępują do obu testów w różnych warunkach (tj. w różnym oświetleniu, o innej porze dnia, o innej porze zakończenia testu itp.), możliwe jest, że uzyskają gorsze wyniki w testach po prostu ze względu na różnice w środowisku testowym.

Sposobem uniknięcia tego rodzaju stronniczości jest zapewnienie, aby uczestnicy przystępowali do obu testów w identycznych warunkach, tj. o tej samej porze dnia, przy tym samym ogólnym oświetleniu i w tym samym otoczeniu, oraz aby mieli ten sam czas na ukończenie testu.

Dodatkowe zasoby

Szybkie wprowadzenie do analizy niezawodności
Czym jest niezawodność podzielona na pół?
Jaka jest wiarygodność między oceniającymi?
Jaka jest niezawodność form równoległych?
Co to jest standardowy błąd pomiaru?

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej

Przykład: obliczanie wiarygodności test-retest

Potencjalne obciążenie w wiarygodności testu-retestu

Dodatkowe zasoby

o autorze

Dr Benjamin Anderson

Dodaj komentarz