Test-tekrar test güvenilirliği nedir? (tanım & #038; örnek)


Araştırmacılar genellikle zeka, yetenek, eğitim yeteneği vb. gibi kavramları ölçmek için bir tür test kullanmak isterler. Belirli bir popülasyonun bireylerinde.

Herhangi bir test türünü uygularken testin güvenilir olması önemlidir. Başka bir deyişle, bir testin sonuçlarının aynı koşullar altında iki farklı zamanda tekrarlanabilmesi önemlidir.

Test-tekrar test güvenilirliği , bir testin güvenilirliğini ölçmenin özel bir yoludur ve bir testin zaman içinde ne kadar benzer sonuçlar ürettiğini ifade eder.

Test-tekrar test güvenilirliğini -1 ile 1 arasında bir değer alan Pearson korelasyon katsayısını kullanarak hesaplıyoruz; burada:

  • -1, iki puan arasında tamamen negatif bir doğrusal korelasyon olduğunu gösterir
  • 0, iki puan arasında doğrusal bir korelasyon olmadığını gösterir
  • 1, iki puan arasında mükemmel pozitif doğrusal bir korelasyonu gösterir

Örneğin, 1 Ocak’ta 50 katılımcıya bir IQ testi verebiliriz ve ardından bir ay sonra aynı türde, benzer zorluktaki IQ testini 50 katılımcıdan oluşan aynı gruba verebiliriz.

Testin iyi bir test-tekrar test güvenilirliğine sahip olup olmadığını belirlemek için iki test arasındaki puanların korelasyonunu hesaplayabiliriz.

Test-tekrar test güvenilirliği

Genel olarak en az 0,80 veya daha yüksek bir test-tekrar test güvenirlik korelasyonu iyi bir güvenirliğe işaret eder.

Örnek: test-tekrar test güvenilirliğinin hesaplanması

Araştırmacıların 20 kişiye bir test verdiğini, ardından bir ay sonra aynı tür testi aynı 20 kişiye uyguladığını varsayalım.

Puanları aşağıda gösterilmektedir:

Test-tekrar test güvenilirliğini hesaplama örneği

İki puan grubu arasındaki Pearson korelasyon katsayısının 0,836 olduğunu bulmak için bir korelasyon hesaplayıcısı kullanabiliriz.

Bu korelasyon 0,80’den büyük olduğundan araştırmacılar testin iyi bir test-tekrar test güvenilirliğine sahip olduğu sonucuna varabilirler.

Başka bir deyişle test, farklı zamanlarda tekrarlanabilecek güvenilir sonuçlar üretir.

Test-tekrar test güvenilirliğinde olası sapma

Test-tekrar test güvenilirliği hesaplamak için yararlı bir ölçümdür ancak bu ölçümü etkileyebilecek aşağıdaki potansiyel önyargıların farkında olun:

1. Pratik etki

Katılımcılar bir testi pratik yaparak geliştirdikleri zaman pratik etkisi ortaya çıkar. Bu, pratik yapmak ve gelişmek için zamanları olduğundan sonraki testlerde muhtemelen daha iyi performans gösterecekleri anlamına gelir.

Bu tür önyargılardan kaçınmanın yolu, bireylere eşit zorlukta ancak farklı soru türlerine sahip testler vermektir, böylece ilk testte sorulan soru türlerinin cevaplarını ezberleyemezler.

2. Yorgunluk etkisi

Yorgunluk etkisi, katılımcıların önceki testleri yaptıktan sonra zihinsel olarak bitkin veya yorgun olmaları nedeniyle belirli testlerde durumu kötüleştiğinde ortaya çıkar.

Bu tür önyargılardan kaçınmanın yolu, testler arasında (ideal olarak haftalar, hatta aylar) yeterli süre bırakmaktır, böylece katılımcılar her iki testi de alırken taze olurlar.

3. Koşullardaki farklılıklar

Katılımcılar iki testi farklı koşullar altında aldıklarında (örn. farklı ışıklandırma, günün farklı saati, testi tamamlamak için farklı zamanlar vb.), test ortamındaki farklılıklar nedeniyle daha düşük farklı test sonuçları elde etmeleri mümkündür.

Bu tür yanlılığı önlemenin yolu, katılımcıların her iki testi de aynı koşullar altında, yani günün aynı saatinde, aynı genel aydınlatma ve aynı ortamda yapmalarını ve testi tamamlamak için aynı zamana sahip olmalarını sağlamaktır.

Ek kaynaklar

Güvenilirlik Analizine Hızlı Bir Giriş
Güvenilirlik ikiye bölünmüş nedir?
Değerlendiriciler arası güvenilirlik nedir?
Paralel formların güvenilirliği nedir?
Standart ölçüm hatası nedir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir