Stata'da tahmini değerler ve artıklar nasıl elde edilir
Doğrusal regresyon, bir veya daha fazla açıklayıcı değişken ile bir yanıt değişkeni arasındaki ilişkiyi anlamak için kullanabileceğimiz bir yöntemdir.
Bir veri seti üzerinde doğrusal regresyon uyguladığımızda, açıklayıcı değişkenlerin değerleri göz önüne alındığında, bir yanıt değişkeninin değerlerini tahmin etmek için kullanılabilecek bir regresyon denklemi elde ederiz.
Daha sonra her tahmin için artıkları elde etmek amacıyla tahmin edilen değerler ile gerçek değerler arasındaki farkı ölçebiliriz. Bu, regresyon modelimizin yanıt değerlerini ne kadar iyi tahmin ettiğine dair bir fikir edinmemize yardımcı olur.
Bu eğitimde Stata’da bir regresyon modeli için hem tahmin edilen değerlerin hem de artıkların nasıl elde edileceği açıklanmaktadır.
Örnek: Tahmin edilen değerler ve artıklar nasıl elde edilir
Bu örnek için, auto adı verilen yerleşik Stata veri kümesini kullanacağız. Açıklayıcı değişkenler olarak mpg ve yer değiştirmeyi , yanıt değişkeni olarak ise fiyatı kullanacağız.
Doğrusal bir regresyon gerçekleştirmek ve ardından regresyon modeli için tahmin edilen değerleri ve artıkları elde etmek için aşağıdaki adımları kullanın.
Adım 1: Verileri yükleyin ve görüntüleyin.
Öncelikle aşağıdaki komutu kullanarak verileri yükleyeceğiz:
sistemin otomatik kullanımı
Daha sonra aşağıdaki komutu kullanarak verilerin hızlı bir özetini alacağız:
özetlemek
Adım 2: Regresyon modelini yerleştirin.
Daha sonra regresyon modeline uyum sağlamak için aşağıdaki komutu kullanacağız:
regresyon fiyatı mpg deplasmanı
Tahmin edilen regresyon denklemi:
tahmini fiyat = 6672,766 -121,1833*(mpg) + 10,50885*(yer değiştirme)
Adım 3: Tahmin edilen değerleri alın.
Tahmin komutunu kullanarak ve bu değerleri istediğimiz gibi isimlendirilmiş bir değişkende saklayarak tahmin edilen değerleri elde edebiliriz. Bu durumda pred_price adını kullanacağız:
pred_price’ı tahmin et
List komutunu kullanarak gerçekleşen fiyatlar ile tahmini fiyatları yan yana görüntüleyebiliriz. Toplamda 74 tahmin edilen değer var ancak in 1/10 komutunu kullanarak yalnızca ilk 10’unu görüntüleyeceğiz:
liste fiyatı pred_price 1/10
Adım 4: Kalıntıyı alın.
Artıklar komutunu kullanarak ve bu değerleri istediğimiz isimdeki bir değişkende saklayarak her tahminin artıklarını elde edebiliriz. Bu durumda resid_price adını kullanacağız:
rezidans_fiyatını, kalanları tahmin edin
Yine list komutunu kullanarak gerçek fiyatı, beklenen fiyatı ve kalanları yan yana görüntüleyebiliriz:
liste fiyatı pred_price resid_price 1/10
Adım 5: Artıklara karşı tahmin edilen değerlerin grafiğini oluşturun.
Son olarak, tahmin edilen değerler ile artıklar arasındaki ilişkiyi görselleştirmek için bir dağılım grafiği oluşturabiliriz:
dağılım ikamet_fiyat pred_price
Ortalama olarak, uyum değerleri arttıkça artıkların da artma eğiliminde olduğunu görebiliriz. Bu, artıkların dağılımının her yanıt seviyesinde sabit olmadığı durumlarda, değişen varyansın bir işareti olabilir.
Breusch-Pagan testini kullanarak değişen varyanslılığı resmi olarak test edebilir ve bunu sağlam standart hatalar kullanarak çözebiliriz.