Çoklu doğrusal gerileme
Bu makale istatistikte çoklu doğrusal regresyonun ne olduğunu açıklamaktadır. Ayrıca çoklu doğrusal regresyon modelinin nasıl oluşturulacağını ve bunun nasıl yorumlanacağını öğreneceksiniz.
Çoklu doğrusal regresyon nedir?
Çoklu doğrusal regresyon, iki veya daha fazla bağımsız değişkenin dahil edildiği bir regresyon modelidir. Başka bir deyişle, çoklu doğrusal regresyon, çeşitli açıklayıcı değişkenlerin bir yanıt değişkenine doğrusal olarak bağlanmasına izin veren istatistiksel bir modeldir.
Bu nedenle, iki veya daha fazla bağımsız değişkeni bir bağımlı değişkenle ilişkilendiren bir denklem bulmak için çoklu doğrusal regresyon modeli kullanılır. Böylece her bağımsız değişkenin değeri yerine koyularak bağımlı değişkenin değerine yaklaşık bir değer elde edilir.
Örneğin, y=3+6x 1 -4x 2 +7x 3 denklemi çoklu doğrusal regresyon modelidir çünkü üç bağımsız değişkeni (x 1 , x 2 , x 3 ) bir bağımlı değişken (y) doğrusal değer yolu ile matematiksel olarak ilişkilendirir .
Çoklu Doğrusal Regresyon Formülü
Çoklu doğrusal regresyon modelinin denklemi şöyledir: y=β 0 +β 1 x 1 +β 2 x 2 +…+β m x m +ε.
Altın:
-
bağımlı değişkendir.
-
bağımsız değişken i’dir.
-
çoklu doğrusal regresyon denkleminin sabitidir.
-
değişkenle ilişkili regresyon katsayısıdır
.
-
Bu hata veya artıktır, yani gözlemlenen değer ile model tarafından tahmin edilen değer arasındaki farktır.
-
modeldeki değişkenlerin toplam sayısıdır.
Toplamda bir örneğimiz varsa
gözlemler için çoklu doğrusal regresyon modelini matris biçiminde önerebiliriz:
Yukarıdaki dizi ifadesi, her diziye bir harf atanarak yeniden yazılabilir:
Böylece, en küçük kareler kriterini uygulayarak çoklu doğrusal regresyon modelinin katsayılarını tahmin etmeye yönelik formüle ulaşmak mümkündür:
Ancak bu formülün uygulanması çok zahmetli ve zaman alıcıdır, bu nedenle pratikte bir regresyon modelinin çok daha hızlı çalıştırılmasına olanak tanıyan bilgisayar yazılımlarının (Minitab veya Excel gibi) kullanılması önerilir.
Çoklu Doğrusal Regresyon Varsayımları
Çoklu doğrusal regresyon modelinde modelin geçerli olabilmesi için aşağıdaki koşulların karşılanması gerekir:
- Bağımsızlık : Kalıntılar birbirinden bağımsız olmalıdır. Model bağımsızlığını sağlamanın yaygın bir yolu örnekleme sürecine rastgelelik eklemektir.
- Homoskedastisite : Artıkların varyanslarında homojenlik olmalı, yani artıkların değişkenliği sabit olmalıdır.
- Çoklu doğrusal olmama : Modelde yer alan açıklayıcı değişkenlerin birbirine bağlanamaması veya en azından ilişkilerinin çok zayıf olması gerekir.
- Normallik : Artıkların normal dağılması veya başka bir deyişle ortalaması 0 olan normal dağılıma uyması gerekir.
- Doğrusallık : Yanıt değişkeni ile açıklayıcı değişkenler arasındaki ilişkinin doğrusal olduğu varsayılmaktadır.
Çoklu Doğrusal Regresyon Modelini Yorumlama
Çoklu doğrusal regresyon modelini yorumlamak için regresyon modelinin açıkladığı yüzdeyi ifade eden belirleme katsayısına (R kare) bakmamız gerekir. Dolayısıyla belirleme katsayısı ne kadar yüksek olursa, model çalışılan veri örneğine o kadar fazla uyarlanacaktır.
Ancak istatistiksel bir modelin uyum iyiliği, özellikle çoklu doğrusal regresyon modellerinde yanıltıcı olabilir. Çünkü modele bir değişken eklenirken değişken anlamlı olmasa bile belirleme katsayısı artar. Ancak modelin daha az karmaşık olması ve yorumlanmasının daha kolay olması nedeniyle değişken sayısını en aza indirmeye çalışarak belirleme katsayısını en üst düzeye çıkarmak gerekir.
Bu sorunu çözmek için, bir regresyon modelinin uyum kalitesini ölçen, düzeltilmemiş katsayıdan farklı olarak modele eklenen her değişken için ceza uygulayan istatistiksel bir katsayı olan düzeltilmiş belirleme katsayısının (düzeltilmiş R kare) hesaplanması gerekir. kararlılık. bu, modeldeki değişkenlerin sayısını hesaba katmaz.
Böylece düzeltilmiş belirleme katsayısı, iki modelin uyum iyiliğini farklı sayıda değişkenle karşılaştırmamıza olanak tanır. Prensip olarak düzeltilmiş belirleme katsayısı daha yüksek olan model seçilmelidir, ancak iki model çok benzer değerlere sahipse yorumlanması daha kolay olduğundan daha az değişkenli modelin seçilmesi daha iyidir.
Buna karşılık, regresyon katsayıları açıklayıcı değişken ile yanıt değişkeni arasındaki ilişkiyi gösterir. Regresyon katsayısı pozitif ise açıklayıcı değişken arttıkça yanıt değişkeni de artacaktır. oysa regresyon katsayısı negatifse açıklayıcı değişken arttığında yanıt değişkeni azalacaktır.
Mantıksal olarak önceki koşulun sağlanması için diğer değişkenlerin sabit kalması gerekir. Bu nedenle modelin farklı açıklayıcı değişkenleri arasında çoklu bağlantı olmaması önemlidir. Web sitemizde ilgili makaleyi arayarak bir modelin çoklu doğrusallığının nasıl incelendiğini görebilirsiniz.
Çoklu ve basit doğrusal regresyon
Son olarak basit doğrusal regresyon modeli ile çoklu doğrusal regresyon modeli arasındaki farkların neler olduğunu göreceğiz çünkü bunlar istatistikte yaygın olarak kullanılan iki regresyon modelidir.
Basit doğrusal regresyon, bağımsız bir değişkeni ilişkilendirmek için kullanılan bir regresyon modelidir. Yani basit bir doğrusal regresyon modelinin denklemi aşağıdaki gibidir:
Bu nedenle çoklu doğrusal regresyon ile basit doğrusal regresyon arasındaki fark, açıklayıcı değişkenlerin sayısında yatmaktadır. Çoklu doğrusal regresyon modelinde iki veya daha fazla açıklayıcı değişken bulunurken, basit doğrusal regresyon modelinde yalnızca bir açıklayıcı değişken bulunur.
Sonuç olarak, çoklu doğrusal regresyon, basit doğrusal regresyonun bir uzantısıdır, çünkü daha fazla açıklayıcı değişken ve bunların ilgili regresyon katsayıları basitçe eklenir. Ancak regresyon katsayıları farklı şekilde hesaplanır; bunun nasıl yapıldığını görmek için buraya tıklayın: