Tahmin geçerliliği nedir? (tanım ve örnekler)
İstatistikte tahmin geçerliliği terimi, gelecekte başka bir değişkenin değerini tahmin etmek için bir ölçekteki veya testteki puanın kullanılmasının ne ölçüde geçerli olduğunu ifade eder.
Örneğin, belirli üniversite giriş sınavlarının öğrencilerin birinci dönem not ortalamasını ne kadar iyi tahmin edebildiğini bilmek isteyebiliriz.
Tahmin geçerliliğinin mevcut olup olmadığını belirlemek için aşağıdaki süreci kullanabiliriz:
- Üniversite giriş sınavını 1000 son sınıf öğrencisine uygulayın.
- Bir yıl sonra, aynı 1000 öğrencinin birinci dönem genel not ortalamasına ilişkin verileri toplayın.
- Giriş sınavı puanları ile ilk dönem genel not ortalaması arasındaki ilişkiyi hesaplayın.
Giriş sınavı puanları ile ilk dönem genel not ortalaması arasında güçlü bir ilişki varsa, bu iki değişken arasında yordama geçerliliğinin olması muhtemeldir.
Başka bir deyişle, bir öğrencinin üniversiteye giriş sınavında aldığı not, onun üniversitenin ilk döneminde elde edeceği genel not ortalamasının göstergesidir .
Örneğin, giriş sınavında yüksek puan alan öğrenciler ilk yarıyıllarda da yüksek puan alma eğilimindedirler. Bunun tersine, giriş sınavında düşük performans gösteren öğrencilerin ilk yarıyıllarında genel not ortalamaları düşük olma eğilimindedir.
Teknik notlar:
Tahmin geçerliliği, bir değişkenin ölçümünün başka bir değişkenin tepkisini tahmin etme yeteneğini ifade eden bir tür kriter geçerliliğidir.
Bir değişkene açıklayıcı değişken , diğer değişkene ise yanıt değişkeni veya ölçüt değişkeni adı verilir.
Önceki örneğimizde açıklayıcı değişken giriş sınavı, kriter değişken ise ilk dönem genel not ortalaması olacaktır.
Tahmine Dayalı Geçerlilik Örnekleri
Aşağıdaki örnekler, tahmin geçerliliğini hesaplayabileceğimiz birkaç ek senaryoyu göstermektedir.
Örnek 1: İşe alım testi
Bir şirket, işe aldığı herkese 40 soruluk bir işe alım öncesi testi uygulayabilir ve ardından bir yıl sonra çalışan verimliliğini değerlendirebilir.
Test sonuçları ile çalışan verimliliği arasında yüksek derecede bir korelasyon varsa o zaman testin bireyin gelecekteki verimliliğini tahmin etmek için kullanılmasının geçerli olduğunu söyleyebiliriz.
Örnek 2: IQ testleri ve gelir
Araştırmacılar 100 kişiye IQ testi uygulayabilir ve 10 yıl sonra bu kişilerin yıllık gelirlerini takip edebilirler.
IQ testi puanları ile bireylerin yıllık geliri arasında yüksek derecede bir korelasyon varsa araştırmacılar, bu testin bireylerin gelecekteki gelirlerini tahmin etmek için kullanılmasının geçerli olduğunu söyleyebilirler.
Örnek 3: Fitness
Kişisel bir antrenör, NBA çaylaklarına bir kondisyon testi uygulayabilir ve ardından ligde önümüzdeki beş yıl boyunca oyuncuların maç başına attığı ortalama puanları kaydedebilir.
Kondisyon testi puanları ile oyuncuların oyun başına aldığı ortalama puanlar arasında yüksek derecede bir korelasyon varsa, kişisel antrenör, testi oyuncuların oyun başına gelecekteki puanlarını tahmin etmek için kullanmanın geçerli olduğunu söyleyebilir.
Tahmin geçerliliği için yüksek korelasyon olarak kabul edilen şey nedir?
Hiçbir spesifik değer, iki değişken arasında “yüksek” bir korelasyon olarak kabul edilmez. Ancak bir test ile ölçmeyi amaçladığı yapı arasındaki korelasyon ne kadar yüksek olursa, testin yordama geçerliliği de o kadar yüksek olur.
Örneğin, işe alım öncesi test ile bir yıl sonraki çalışan verimliliği arasındaki korelasyon 0,86 ise, bu test, yalnızca 0,35 korelasyona sahip olan bir testten daha fazla çalışan verimliliği öngörüsüne sahiptir.
Bununla birlikte, oldukça düşük görünen bir korelasyon bile (r = 0,35 gibi) bir işveren için yine de yararlı olabilir çünkü onlara en azından çalışanın olası verimliliği hakkında bir fikir verir.
Ek kaynaklar
Kriter geçerliliğinin basit bir açıklaması
Kriter değişkeni nedir?
Eşzamanlı geçerlilik nedir?