Stata'da regresyonda sağlam standart hatalar nasıl kullanılır?
Çoklu doğrusal regresyon, birden fazla açıklayıcı değişken ile bir yanıt değişkeni arasındaki ilişkiyi anlamak için kullanabileceğimiz bir yöntemdir.
Ne yazık ki, regresyonda sıklıkla ortaya çıkan bir sorun, ölçülen değerler aralığı boyunca artıkların varyansında sistematik bir değişikliğin olduğu, değişen varyans olarak bilinir.
Bu durum regresyon katsayısı tahminlerinin varyansının artmasına neden olur ancak regresyon modeli bunu dikkate almaz. Bu, gerçekte öyle olmadığı halde, bir regresyon modelinin, modeldeki bir terimin istatistiksel olarak anlamlı olduğunu iddia etme olasılığını çok daha artırır.
Bu sorunu açıklamanın bir yolu, heteroskedastisite sorununa karşı daha “sağlam” olan ve bir regresyon katsayısının gerçek standart hatasının daha doğru bir ölçümünü sağlama eğiliminde olan sağlam standart hataların kullanılmasıdır.
Bu eğitimde Stata’da regresyon analizinde sağlam standart hataların nasıl kullanılacağı açıklanmaktadır.
Örnek: Stata’daki sağlam standart hatalar
Regresyonda sağlam standart hataların nasıl kullanılacağını göstermek için otomatik olarak entegre edilen Stata veri kümesini kullanacağız.
Adım 1: Verileri yükleyin ve görüntüleyin.
Öncelikle verileri yüklemek için aşağıdaki komutu kullanın:
sistemin otomatik kullanımı
Daha sonra aşağıdaki komutu kullanarak ham verileri görüntüleyin:
br
Adım 2: Sağlam standart hatalar olmadan çoklu doğrusal regresyon gerçekleştirin.
Daha sonra, yanıt değişkeni olarak fiyatı ve açıklayıcı değişkenler olarak mpg ve ağırlığı kullanarak çoklu doğrusal regresyon gerçekleştirmek için aşağıdaki komutu gireceğiz:
regresyon fiyatı mpg ağırlığı
Adım 3: Sağlam standart hataları kullanarak çoklu doğrusal regresyon gerçekleştirin.
Şimdi tam olarak aynı çoklu doğrusal regresyonu gerçekleştireceğiz, ancak bu sefer vce(robust) komutunu kullanacağız, böylece Stata sağlam standart hataların nasıl kullanılacağını bilir:
regresyon fiyatı mpg ağırlığı, vce (sağlam)
Burada dikkat edilmesi gereken birkaç ilginç nokta var:
1. Katsayı tahminleri aynı kaldı . Sağlam standart hatalar kullandığımızda katsayı tahminleri hiç değişmez. Mpg, ağırlık ve sabit için katsayı tahminlerinin her iki regresyon için de aşağıdaki gibi olduğuna dikkat edin:
- mpg: -49.51222
- ağırlık: 1,746559
- _karşı: 1946.069
2. Standart hatalar değişti . Sağlam standart hatalar kullandığımızda, katsayı tahminlerinin her biri için standart hataların arttığını unutmayın.
Not: Çoğu durumda sağlam standart hatalar normal standart hatalardan daha büyük olacaktır, ancak nadir durumlarda sağlam standart hataların gerçekte daha küçük olması mümkündür.
3. Her katsayının test istatistiği değişti. Her test istatistiğinin mutlak değeri olan t’nin azaldığına dikkat edin. Aslında test istatistiği, tahmin edilen katsayının standart hataya bölünmesiyle hesaplanır. Dolayısıyla standart hata ne kadar büyük olursa, test istatistiğinin mutlak değeri de o kadar küçük olur.
4. P değerleri değişti . Her değişkenin p değerlerinin de arttığını unutmayın. Bunun nedeni, daha küçük test istatistiklerinin daha büyük p değerleri ile ilişkili olmasıdır.
Katsayılarımız için p değerleri değişmiş olsa da mpg değişkeni α = 0,05’te hala istatistiksel olarak anlamlı değildir ve değişken ağırlığı α = 0,05’te hala istatistiksel olarak anlamlıdır.