Stata'da basit doğrusal regresyon nasıl gerçekleştirilir
Basit doğrusal regresyon, açıklayıcı değişken x ile yanıt değişkeni y arasındaki ilişkiyi anlamak için kullanabileceğiniz bir yöntemdir.
Bu eğitimde Stata’da basit bir doğrusal regresyonun nasıl gerçekleştirileceği açıklanmaktadır.
Örnek: Stata’da Basit Doğrusal Regresyon
Bir arabanın ağırlığı ile galon başına kat ettiği mesafe arasındaki ilişkiyi anlamak istediğimizi varsayalım. Bu ilişkiyi araştırmak için, açıklayıcı değişken olarak ağırlığı ve yanıt değişkeni olarak galon başına mili kullanarak basit bir doğrusal regresyon gerçekleştirebiliriz.
74 farklı arabaya ilişkin verileri içeren auto adlı veri kümesini kullanarak basit bir doğrusal regresyon gerçekleştirmek için Stata’da aşağıdaki adımları tamamlayın.
Adım 1: Verileri yükleyin.
Komut kutusuna aşağıdakini yazarak verileri yükleyin:
https://www.stata-press.com/data/r13/auto adresini kullanın
Adım 2: Bir veri özeti alın.
Komut kutusuna aşağıdakini yazarak, üzerinde çalıştığınız verileri hızlı bir şekilde anlayın:
özetlemek
Veri setinde 12 farklı değişken olduğunu görebiliriz ancak önemsediğimiz sadece ikisi mpg ve ağırlıktır .
Adım 3: Verileri görselleştirin.
Basit bir doğrusal regresyon gerçekleştirmeden önce, bu iki değişken arasındaki ilişkiyi görselleştirebilmemiz ve bariz aykırı değerleri kontrol edebilmemiz için öncelikle ağırlık ve mpg’nin dağılım grafiğini oluşturalım. Dağılım grafiği oluşturmak için Komut kutusuna aşağıdakini yazın:
mpg ağırlık dağılımı
Bu, aşağıdaki dağılım grafiğini üretir:
Daha yüksek ağırlığa sahip arabaların galon başına daha az kilometre kat etme eğiliminde olduğunu görebiliriz. Bu ilişkiyi ölçmek için şimdi basit bir doğrusal regresyon gerçekleştireceğiz.
Adım 4: Basit bir doğrusal regresyon gerçekleştirin.
Açıklayıcı değişken olarak ağırlığı ve yanıt değişkeni olarak mpg’yi kullanarak basit bir doğrusal regresyon gerçekleştirmek için Komut kutusuna aşağıdakini yazın.
ağırlığı mpg’ye gerile
Sonuçtaki en ilginç sayıları nasıl yorumlayacağınız aşağıda açıklanmıştır:
R kare: 0,6515. Bu, açıklayıcı değişken tarafından açıklanabilen yanıt değişkenindeki varyansın oranıdır. Bu örnekte mpg’deki değişimin %65,15’i ağırlıkla açıklanabilir.
Katsayısı (ağırlık): -0,006. Bu bize açıklayıcı değişkendeki bir birimlik artışla ilişkili yanıt değişkenindeki ortalama değişimi anlatır. Bu örnekte, ağırlıktaki her bir poundluk artış, ortalama 0,006 mpg’lik bir azalmayla ilişkilidir.
Katsayı (_cons): 39.44028. Bu bize açıklayıcı değişken sıfır olduğunda yanıt değişkeninin ortalama değerini verir. Bu örnekte, bir arabanın ağırlığı sıfır olduğunda ortalama mpg 39,44028’dir. Bir arabanın ağırlığı sıfır olamayacağından bunu yorumlamak gerçekten mantıklı değil, ancak 39.44028 sayısı bir regresyon denklemi oluşturmak için gereklidir.
P>|t| (ağırlık): 0,000. Bu, ağırlık için test istatistiğiyle ilişkili p değeridir. Bu durumda bu değer 0,05’ten küçük olduğundan ağırlık ile mpg arasında istatistiksel olarak anlamlı bir ilişkinin olduğu sonucuna varabiliriz.
Regresyon denklemi: Son olarak iki katsayı değerini kullanarak bir regresyon denklemi oluşturabiliriz. Bu durumda denklem şu şekilde olacaktır:
tahmin edilen mpg = 39,44028 – 0,0060087*(ağırlık)
Ağırlığı göz önüne alındığında bir arabanın beklenen mpg’sini bulmak için bu denklemi kullanabiliriz. Örneğin, 4.000 pound ağırlığındaki bir arabanın mpg’si 15.405 olmalıdır:
tahmin edilen mpg = 39,44028 – 0,0060087*(4000) = 15,405
Adım 5: Sonuçları rapor edin.
Son olarak basit doğrusal regresyonumuzun sonuçlarını bildirmek istiyoruz. İşte bunun nasıl yapılacağına dair bir örnek:
Bir arabanın ağırlığı ile galon başına kat ettiği mesafe arasındaki ilişkiyi ölçmek için doğrusal bir regresyon gerçekleştirildi. Analizde 74 arabadan oluşan bir örnek kullanıldı.
Sonuçlar, ağırlık ile mpg arasında istatistiksel olarak anlamlı bir ilişki olduğunu (t = -11,60, p < 0,0001) ve ağırlığın mpg’de açıklanan değişkenliğin %65,15’ini oluşturduğunu gösterdi.
Regresyon denklemi şu şekilde ortaya çıktı:
tahmin edilen mpg = 39,44 – 0,006 (ağırlık)
Her ilave pound, ortalama olarak galon başına -0,006 mil düşüşle ilişkilendirildi.