Standartlaştırılmış ve standartlaştırılmamış regresyon katsayıları
Çoklu doğrusal regresyon, iki veya daha fazla öngörücü değişken ile bir yanıt değişkeni arasındaki ilişkiyi ölçmenin yararlı bir yoludur.
Tipik olarak çoklu doğrusal regresyon uyguladığımızda ortaya çıkan regresyon katsayıları standartlaştırılmaz , yani en uygun çizgiyi bulmak için ham verileri kullanırlar.
Bununla birlikte, yordayıcı değişkenler tamamen farklı ölçeklerde ölçüldüğünde, standartlaştırılmış katsayılarla sonuçlanan, standartlaştırılmış verileri kullanarak çoklu doğrusal regresyon gerçekleştirmek yararlı olabilir.
Bu fikri anlamanıza yardımcı olmak için basit bir örnek üzerinden gidelim.
Örnek: Standartlaştırılmış ve standartlaştırılmamış regresyon katsayıları
12 evin yaşı, metrekaresi ve satış fiyatına ilişkin bilgileri içeren aşağıdaki veri setine sahip olduğumuzu varsayalım:
Daha sonra, tahmin değişkenleri olarak yaş ve metrekareyi ve yanıt değişkeni olarak fiyatı kullanarak çoklu doğrusal regresyon uyguladığımızı varsayalım.
İşte regresyonun sonucu :
Bu tablodaki regresyon katsayıları standartlaştırılmamıştır ; bu, bu regresyon modeline uymak için ham verileri kullandıkları anlamına gelir. İlk bakışta, tahmin değişkeni metrekare için sadece 100.866 iken regresyon tablosundaki katsayısı -409.833 olduğundan yaşın gayrimenkul fiyatı üzerinde çok daha büyük bir etkisi olduğu görülüyor.
Bununla birlikte, standart hata yaşa göre metrekareye göre çok daha büyüktür; bu nedenle karşılık gelen p değeri aslında yaşa göre büyük (p = 0,520) ve metrekareye göre küçük (p = 0,000) neden olur.
Regresyon katsayılarındaki aşırı farklılıkların nedeni, iki değişken için ölçeklerdeki aşırı farklılıklardan kaynaklanmaktadır:
- Yaşa göre değerler 4 ile 44 yaş arasında değişmektedir.
- Metrekare değerleri 1.200 ile 2.800 arasında değişmektedir.
Bunun yerine, her orijinal veri değerini bir z puanına dönüştürerek orijinal ham verileri normalleştirdiğimizi varsayalım:
Daha sonra standartlaştırılmış verileri kullanarak çoklu doğrusal regresyon gerçekleştirirsek aşağıdaki regresyon sonucunu elde ederiz:
Bu tablodaki regresyon katsayıları standartlaştırılmıştır , yani bu regresyon modeline uymak için standartlaştırılmış veriler kullanılmıştır. Tablodaki katsayıların yorumlanma şekli şu şekildedir:
- Metrekarenin sabit kaldığı varsayıldığında, yaştaki bir standart sapmalık artış, ev fiyatında 0,092 standart sapmalık bir düşüşle ilişkilidir.
- Yaşın sabit kaldığı varsayıldığında , metrekaredeki bir standart sapmalık artış, ev fiyatındaki 0,885 standart sapmalık artışla ilişkilidir.
Metrekarenin emlak fiyatları üzerinde yaştan çok daha büyük bir etkiye sahip olduğunu hemen görebiliyoruz. Ayrıca her bir yordayıcı değişkenin p değerlerinin önceki regresyon modelindekilerle tamamen aynı olduğunu unutmayın.
İlgili: Excel’de Z Puanları Nasıl Hesaplanır?
Standartlaştırılmış veya standartlaştırılmamış regresyon katsayıları ne zaman kullanılmalı?
Duruma bağlı olarak hem standartlaştırılmış hem de standartlaştırılmamış regresyon katsayıları faydalı olabilir. Özellikle:
Standartlaştırılmamış regresyon katsayıları, yordayıcı değişkendeki bir birimlik değişikliğin yanıt değişkeni üzerindeki etkisini yorumlamak istediğinizde kullanışlıdır. Yukarıdaki örnekte, yordayıcı değişkenler ile yanıt değişkeni arasındaki kesin ilişkiyi anlamak için ilk regresyondaki standartlaştırılmamış regresyon katsayılarını kullanabiliriz:
- Metrekarenin sabit kaldığı varsayıldığında, yaştaki bir birimlik artış, ev fiyatında ortalama 409 dolarlık bir düşüşle ilişkilendirildi. Bu katsayının istatistiksel olarak anlamlı olmadığı ortaya çıktı (p=0,520).
- Yaşın sabit kaldığı varsayıldığında, metrekaredeki bir birimlik artış, ev fiyatlarında ortalama 100 dolarlık bir artışla ilişkilendirildi. Bu katsayı istatistiksel olarak da anlamlı bulunmuştur (p=0,000).
Standartlaştırılmış regresyon katsayıları, farklı yordayıcı değişkenlerin bir yanıt değişkeni üzerindeki etkisini karşılaştırmak istediğinizde kullanışlıdır. Her değişken standartlaştırıldığı için hangi değişkenin yanıt değişkeni üzerinde en büyük etkiye sahip olduğunu görebilirsiniz.
Standartlaştırılmış regresyon katsayılarının dezavantajı yorumlanmalarının biraz daha zor olmasıdır. Örneğin bir birim yaş artışının gayrimenkul fiyatı üzerindeki etkisini anlamak, bir standart sapmalık artışın gayrimenkul fiyatı üzerindeki etkisini anlamaktan daha kolaydır.
Ek kaynaklar
Regresyon Tablosu Nasıl Okunmalı ve Yorumlanmalı
Regresyon katsayıları nasıl yorumlanır?
Excel’de Çoklu Doğrusal Regresyon Nasıl Gerçekleştirilir