Güvenilirlik analizi nedir? (tanım & #038; örnek)
İstatistikte güvenilirlik terimi, bir ölçümün tutarlılığını ifade eder.
Zeka, bilgi, üretkenlik, verimlilik vb. gibi bir şeyi ölçersek. birden çok kez ölçemeyiz. bireylerde ölçümler tutarlı mı?
İdeal olarak, araştırmacılar bir testin son derece güvenilir olmasını isterler çünkü bu, zaman içinde tutarlı ölçümler sağladığı ve test sonuçlarına güvenilebileceği anlamına gelir.
Güvenilirliği ölçmenin dört yolu olduğu ortaya çıktı:
1. Yarıya Bölme Güvenilirliği Yöntemi – Kötü ifade edilmiş sorular veya kafa karıştırıcı talimatlar gibi zayıf test yapısından kaynaklanan test sonuçlarındaki hatanın derecesini belirler.
Bu yöntem aşağıdaki işlemi kullanır:
- Bir testi ikiye bölün. Örneğin bir yarısı çift sorulardan, diğer yarısı ise tek sorulardan oluşabilir.
- Her yarıyı aynı kişiye uygulayın.
- Büyük bir grup birey için tekrarlayın.
- İki yarının puanları arasındaki korelasyonu hesaplayın.
İki yarı arasındaki korelasyon ne kadar yüksek olursa, test veya anketin iç tutarlılığı da o kadar yüksek olur. İdeal durumda, yarılar arasındaki korelasyonun yüksek olmasını istersiniz çünkü bu, testin tüm bölümlerinin ölçülen şeye eşit katkıda bulunduğunu gösterir.
2. Test-tekrar test güvenilirlik yöntemi – Gürültülü ortam, zayıf aydınlatma, testi tamamlamak için yetersiz zaman gibi yönetim sorunları nedeniyle test sonuçlarındaki hata derecesini belirler.
Bu yöntem aşağıdaki işlemi kullanır:
- Bir grup kişiye bir test uygulayın.
- Belirli bir süre bekleyin (günler, haftalar veya aylar) ve aynı testi aynı grup kişiye uygulayın.
- İki testin puanları arasındaki korelasyonu hesaplayın.
Genel olarak en az 0,80 veya daha yüksek bir test-tekrar test güvenirlik korelasyonu iyi bir güvenirliğe işaret eder.
3. Paralel Formlar Güvenilirlik Yöntemi – Dışarıdan gelen etkiler nedeniyle test sonuçlarındaki hatanın derecesini belirler – örneğin, öğrencilerin sorulara önceden erişebilmesi veya öğrencilerin ‘sadece daha fazlasına yol açacak şekilde daha yüksek puanlar alması.
Bu yöntem aşağıdaki işlemi kullanır:
- Bir testin bir versiyonunu bir grup kişiye uygulayın.
- Testin alternatif fakat aynı derecede zor bir versiyonunu aynı grup bireylere uygulayın.
- İki testin puanları arasındaki korelasyonu hesaplayın.
4. Değerlendiriciler arası güvenilirlik yöntemi – Bir testteki her bir maddenin, ölçülen gerçek yapıyı ne kadar tutarlı bir şekilde ölçtüğünü belirler; örneğin, tüm sorular açıkça iletilmiş mi ve ölçülen yapıyla ilgili mi?
Bu yöntem, birkaç eğitimli değerlendiricinin veya hakemin bir testteki her bir öğeyi değerlendirmesini ve ardından değerlendiriciler veya jüri üyeleri arasındaki genel anlaşma yüzdesinin hesaplanmasını içerir.
Hakimler arasındaki anlaşma yüzdesi ne kadar yüksek olursa, testin güvenilirliği de o kadar yüksek olur.
Güvenilirlik ve geçerlilik
Güvenilirlik , bir ölçümün tutarlılığını, geçerlilik ise bir test veya ölçeğin ölçmeyi amaçladığı yapıyı ne ölçüde ölçtüğünü ifade eder.
İyi bir test veya ölçek, hem yüksek güvenirliğe hem de geçerliliğe sahip olandır. Ancak bir testin veya ölçeğin geçerli olmadan da güvenilir olması mümkündür.
Örneğin, kutuları tartan belirli bir terazinin, gerçek ağırlığından sürekli olarak 10 pound daha fazla ağırlığa sahip olduğunu varsayalım. Bu terazi, ölçümleri tutarlı olduğu için güvenilirdir, ancak gerçek ağırlık değerini ölçmediği için geçersizdir.
Güvenilirlik ve ölçümün standart hatası
Tekrarlanan ölçümler alındığında bir bireyin “gerçek” puanı etrafındaki değişimi tahmin eden standart ölçüm hatasını hesaplamak için bir güvenilirlik katsayısı da kullanılabilir.
Aşağıdaki şekilde hesaplanır:
SE m = s√ 1-R
Altın:
- s: ölçümlerin standart sapması
- A: Bir testin güvenirlik katsayısı
Standart ölçüm hatasının ayrıntılı açıklaması için bu makaleye bakın.