Doğrusal regresyonda p değerleri nasıl yorumlanır (örnekle)
İstatistikte doğrusal regresyon modelleri, bir veya daha fazla öngörücü değişken ile bir yanıt değişkeni arasındaki ilişkiyi ölçmek için kullanılır.
İstatistiksel yazılım kullanarak her regresyon analizi gerçekleştirdiğinizde, modelin sonuçlarını özetleyen bir regresyon tablosu alacaksınız.
Bir regresyon tablosundaki en önemli değerlerden ikisi regresyon katsayıları ve bunlara karşılık gelen p değerleridir .
P değerleri size her bir yordayıcı değişken ile yanıt değişkeni arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını söyler.
Aşağıdaki örnek, çoklu doğrusal regresyon modelinin p değerlerinin pratikte nasıl yorumlanacağını göstermektedir.
Örnek: Bir Regresyon Modelinde P Değerlerini Yorumlamak
Aşağıdaki değişkenleri kullanarak bir regresyon modeline uymak istediğimizi varsayalım :
Tahmini değişkenler
- Toplam çalışılan saat sayısı (0 ile 20 arası)
- Öğrencinin özel öğretmen kullanıp kullanmadığı (evet veya hayır)
Yanıt değişkeni
- Sınav Puanı (0 ile 100 arası)
Çalışma ve ders saatlerinin sınav puanları üzerinde gerçekten önemli bir etkisi olup olmadığını öğrenmek için yordayıcı değişkenler ile yanıt değişkeni arasındaki ilişkiyi incelemek istiyoruz.
Bir regresyon analizi yaptığımızı ve aşağıdaki sonucu elde ettiğimizi varsayalım:
Terim | Katsayı | Standart hata | İstatistikler | P değeri |
---|---|---|---|---|
Tutmak | 48.56 | 14:32. | 3.39 | 0,002 |
Çalışılan saatler | 2.03 | 0,67 | 3.03 | 0,009 |
Özel öğretmen | 8.34 | 5.68 | 1.47 | 0,138 |
Modeldeki her bir terimin sonucunun nasıl yorumlanacağı aşağıda açıklanmıştır:
Kesişme için P değerinin yorumlanması
Bir regresyon tablosundaki orijinal terim bize, tüm yordayıcı değişkenler sıfıra eşit olduğunda yanıt değişkeni için beklenen ortalama değeri söyler.
Bu örnekte orijin için regresyon katsayısı 48,56’ya eşittir. Bu, sıfır saat eğitim almış bir öğrenci için beklenen ortalama sınav puanının 48,56 olduğu anlamına gelir.
P değeri 0,002’dir ve bu bize orijinal terimin istatistiksel olarak sıfırdan farklı olduğunu söyler.
Uygulamada genellikle orijinal terimin p değerini önemsemeyiz. P değeri belirli bir anlamlılık düzeyinin altında olmasa bile (örneğin 0,05), orijinal terimi yine de modelde tutacağız.
Sürekli bir tahmin değişkeni için P değerinin yorumlanması
Bu örnekte çalışılan saat , 0 ila 20 saat arasında değişen sürekli bir öngörücü değişkendir.
Regresyon sonucundan çalışılan saatlere ait regresyon katsayısının 2,03 olduğunu görüyoruz. Bu, tahmin değişkeni Tutor’un sabit tutulduğu varsayıldığında, çalışılan her ek saatin final sınavında ortalama 2,03 puanlık bir artışla ilişkili olduğu anlamına gelir.
Örneğin, 10 saat ders çalışan ve özel öğretmen kullanan A öğrencisini düşünün. Ayrıca 11 saat çalışan ve aynı zamanda özel öğretmen kullanan Öğrenci B’yi de düşünün. Regresyon sonuçlarımıza göre Öğrenci B’nin sınavda Öğrenci A’dan 2,03 puan daha yüksek alması bekleniyor.
Karşılık gelen p değeri 0,009’dur ve bu, 0,05 alfa düzeyinde istatistiksel olarak anlamlıdır.
Bu bize, çalışılan her ek saat için sınav puanlarındaki ortalama değişimin istatistiksel olarak anlamlı derecede sıfırdan farklı olduğunu söyler.
Başka bir deyişle, çalışılan saatlerin sınav puanı yanıt değişkeni ile istatistiksel olarak anlamlı bir ilişkisi vardır.
Kategorik bir öngörücü değişken için P değerinin yorumlanması
Bu örnekte Tutor , iki farklı değer alabilen kategorik bir tahmin değişkenidir:
- 1 = öğrenci sınava hazırlanmak için bir öğretmen kullandı
- 0 = öğrenci sınava hazırlanmak için bir öğretmen kullanmadı
Regresyon sonucunda Tutor için regresyon katsayısının 8,34 olduğunu görüyoruz. Bu, çalışılan saat tahmin değişkeninin sabit kaldığı varsayıldığında, özel öğretmen kullanan bir öğrencinin, özel öğretmen kullanmayan bir öğrenciden sınavda ortalama 8,34 puan daha yüksek puan aldığı anlamına gelir.
Örneğin, 10 saat ders çalışan ve özel öğretmen kullanan A öğrencisini düşünün. Ayrıca 10 saat çalışan ve özel öğretmen kullanmayan Öğrenci B’yi de düşünün. Regresyon sonuçlarımıza göre Öğrenci A’nın Öğrenci B’den 8,34 puan daha yüksek bir sınav puanı alması bekleniyor.
Karşılık gelen p değeri 0,138’dir ve bu, 0,05 alfa seviyesinde istatistiksel olarak anlamlı değildir.
Bu bize, çalışılan her ek saat için sınav puanlarındaki ortalama değişimin istatistiksel olarak sıfırdan önemli ölçüde farklı olmadığını göstermektedir.
Başka bir deyişle: Öğretmen yordayıcı değişkeninin, sınav puanı yanıt değişkeni ile istatistiksel olarak anlamlı bir ilişkisi yoktur.
Bu durum, özel ders veren öğrencilerin sınavda daha iyi performans gösterse de bu farkın şans eseri olabileceğini gösteriyor.
Ek kaynaklar
Aşağıdaki eğitimler doğrusal regresyon hakkında ek bilgi sağlar:
Regresyonda genel anlamlılık için F testi nasıl yorumlanır?
Çoklu doğrusal regresyonun beş varsayımı
Doğrusal regresyonda t-testini anlama