Excel'de regresyon çıktısı nasıl yorumlanır
Çoklu doğrusal regresyon tüm istatistiklerde en sık kullanılan tekniklerden biridir.
Bu eğitimde, Excel’de çoklu doğrusal regresyon modelinin çıktısındaki her bir değerin nasıl yorumlanacağı açıklanmaktadır.
Örnek: Excel’de Regresyon Çıktısını Yorumlama
Diyelim ki, ders çalışmak için harcanan saatlerin ve alınan hazırlık sınavlarının sayısının, bir öğrencinin belirli bir üniversiteye giriş sınavında aldığı notu etkileyip etkilemediğini bilmek istiyoruz.
Bu ilişkiyi araştırmak için, çalışılan saatleri ve alınan hazırlık sınavlarını yordayıcı değişkenler olarak ve sınav puanlarını yanıt değişkeni olarak kullanarak çoklu doğrusal regresyon yapabiliriz.
Aşağıdaki ekran görüntüsü bu modelin Excel’deki regresyon çıktısını göstermektedir:
Çıktıdaki en büyük değerlerin nasıl yorumlanacağı aşağıda açıklanmıştır:
Çoklu R: 0,857 . Bu, yanıt değişkeni ile iki yordayıcı değişken arasındaki çoklu korelasyonu temsil eder.
R Kare: 0,734 . Buna belirleme katsayısı denir. Açıklayıcı değişkenler tarafından açıklanabilen yanıt değişkeninin varyansının oranıdır. Bu örnekte sınav puanlarındaki farklılığın %73,4’ü çalışılan saat ve girilen hazırlık sınavı sayısıyla açıklanmaktadır.
Düzeltilmiş R kare: 0,703 . Bu, modeldeki yordayıcı değişkenlerin sayısına göre ayarlanan R Kare değerini temsil eder. Bu değer aynı zamanda R Kare değerinden daha düşük olacak ve modelde çok fazla öngörücü değişken kullanan modelleri cezalandıracaktır.
Standart hata: 5,366 . Bu, gözlemlenen değerler ile regresyon çizgisi arasındaki ortalama mesafedir. Bu örnekte gözlemlenen değerler regresyon doğrusundan ortalama 5.366 birim sapmaktadır.
Yorumlar: 20 . Regresyon modelini oluşturmak için kullanılan veri kümesinin toplam örnek boyutu.
F: 23:46 Bu, regresyon modeli için regresyon MS/artık MS olarak hesaplanan genel F istatistiğidir.
Anlamı F: 0,0000 . Bu, genel F istatistiğiyle ilişkili p değeridir. Bu bize regresyon modelinin bir bütün olarak istatistiksel olarak anlamlı olup olmadığını söyler.
Bu durumda p değeri 0,05’ten küçüktür; bu durum, açıklayıcı değişkenlerin , çalışılan saatlerin ve girilen hazırlık sınavlarının birleşiminin sınav sonucuyla istatistiksel olarak anlamlı bir ilişkiye sahip olduğunu gösterir.
Katsayılar: Her bir açıklayıcı değişkenin katsayıları, diğer açıklayıcı değişkenin sabit kaldığı varsayılarak, bize yanıt değişkeninde beklenen ortalama değişimi söyler.
Örneğin, alınan deneme sınavlarının sabit kaldığı varsayılarak, ders çalışmak için harcanan her ek saat için ortalama sınav puanının 5,56 artması beklenir.
Kesişme katsayısını, ders saati çalışmayan ve hazırlık sınavına girmeyen bir öğrenci için beklenen sınav puanının 67,67 olduğu şeklinde yorumluyoruz.
P değerleri. Bireysel p değerleri bize her açıklayıcı değişkenin istatistiksel olarak anlamlı olup olmadığını söyler. Çalışılan saatlerin istatistiksel olarak anlamlı olduğunu (p = 0,00), alınan hazırlık sınavlarının (p = 0,52) α = 0,05’te istatistiksel olarak anlamlı olmadığını görebiliriz.
Tahmini regresyon denklemi nasıl yazılır
Aşağıdaki tahmini regresyon denklemini oluşturmak için model çıktısındaki katsayıları kullanabiliriz:
Sınav puanı = 67,67 + 5,56*(saat) – 0,60*(hazırlık sınavları)
Bu tahmini regresyon denklemini, bir öğrencinin çalışma saati ve girdiği deneme sınavlarının sayısına bağlı olarak beklenen sınav puanını hesaplamak için kullanabiliriz.
Örneğin üç saat çalışıp hazırlık sınavına giren bir öğrencinin notunun 83,75 olması gerekir:
Sınav puanı = 67,67 + 5,56*(3) – 0,60*(1) = 83,75
Geçmiş hazırlık sınavlarının istatistiksel olarak anlamlı olmaması (p=0,52) nedeniyle modelin geneline herhangi bir iyileştirme sağlamaması nedeniyle bunları kaldırmaya karar verebileceğimizi unutmayın.
Bu durumda açıklayıcı değişken olarak yalnızca çalışılan saatleri kullanarak basit bir doğrusal regresyon gerçekleştirebiliriz.
Ek kaynaklar
Basit Doğrusal Regresyona Giriş
Çoklu Doğrusal Regresyona Giriş