Çoklu doğrusal gerileme

Bu makale istatistikte çoklu doğrusal regresyonun ne olduğunu açıklamaktadır. Ayrıca çoklu doğrusal regresyon modelinin nasıl oluşturulacağını ve bunun nasıl yorumlanacağını öğreneceksiniz.

Çoklu doğrusal regresyon nedir?

Çoklu doğrusal regresyon, iki veya daha fazla bağımsız değişkenin dahil edildiği bir regresyon modelidir. Başka bir deyişle, çoklu doğrusal regresyon, çeşitli açıklayıcı değişkenlerin bir yanıt değişkenine doğrusal olarak bağlanmasına izin veren istatistiksel bir modeldir.

Bu nedenle, iki veya daha fazla bağımsız değişkeni bir bağımlı değişkenle ilişkilendiren bir denklem bulmak için çoklu doğrusal regresyon modeli kullanılır. Böylece her bağımsız değişkenin değeri yerine koyularak bağımlı değişkenin değerine yaklaşık bir değer elde edilir.

Örneğin, y=3+6x 1 -4x 2 +7x 3 denklemi çoklu doğrusal regresyon modelidir çünkü üç bağımsız değişkeni (x 1 , x 2 , x 3 ) bir bağımlı değişken (y) doğrusal değer yolu ile matematiksel olarak ilişkilendirir .

Çoklu Doğrusal Regresyon Formülü

Çoklu doğrusal regresyon modelinin denklemi şöyledir: y=β 01 x 12 x 2 +…+β m x m +ε.

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

Altın:

  • y

    bağımlı değişkendir.

  • x_i

    bağımsız değişken i’dir.

  • \beta_0

    çoklu doğrusal regresyon denkleminin sabitidir.

  • \beta_i

    değişkenle ilişkili regresyon katsayısıdır

    x_i

    .

  • \bm{\varepsilon}

    Bu hata veya artıktır, yani gözlemlenen değer ile model tarafından tahmin edilen değer arasındaki farktır.

  • m

    modeldeki değişkenlerin toplam sayısıdır.

Toplamda bir örneğimiz varsa

n

gözlemler için çoklu doğrusal regresyon modelini matris biçiminde önerebiliriz:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

Yukarıdaki dizi ifadesi, her diziye bir harf atanarak yeniden yazılabilir:

Y=X\beta+\varepsilon

Böylece, en küçük kareler kriterini uygulayarak çoklu doğrusal regresyon modelinin katsayılarını tahmin etmeye yönelik formüle ulaşmak mümkündür:

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

Ancak bu formülün uygulanması çok zahmetli ve zaman alıcıdır, bu nedenle pratikte bir regresyon modelinin çok daha hızlı çalıştırılmasına olanak tanıyan bilgisayar yazılımlarının (Minitab veya Excel gibi) kullanılması önerilir.

Çoklu Doğrusal Regresyon Varsayımları

Çoklu doğrusal regresyon modelinde modelin geçerli olabilmesi için aşağıdaki koşulların karşılanması gerekir:

  • Bağımsızlık : Kalıntılar birbirinden bağımsız olmalıdır. Model bağımsızlığını sağlamanın yaygın bir yolu örnekleme sürecine rastgelelik eklemektir.
  • Homoskedastisite : Artıkların varyanslarında homojenlik olmalı, yani artıkların değişkenliği sabit olmalıdır.
  • Çoklu doğrusal olmama : Modelde yer alan açıklayıcı değişkenlerin birbirine bağlanamaması veya en azından ilişkilerinin çok zayıf olması gerekir.
  • Normallik : Artıkların normal dağılması veya başka bir deyişle ortalaması 0 olan normal dağılıma uyması gerekir.
  • Doğrusallık : Yanıt değişkeni ile açıklayıcı değişkenler arasındaki ilişkinin doğrusal olduğu varsayılmaktadır.

Çoklu Doğrusal Regresyon Modelini Yorumlama

Çoklu doğrusal regresyon modelini yorumlamak için regresyon modelinin açıkladığı yüzdeyi ifade eden belirleme katsayısına (R kare) bakmamız gerekir. Dolayısıyla belirleme katsayısı ne kadar yüksek olursa, model çalışılan veri örneğine o kadar fazla uyarlanacaktır.

Ancak istatistiksel bir modelin uyum iyiliği, özellikle çoklu doğrusal regresyon modellerinde yanıltıcı olabilir. Çünkü modele bir değişken eklenirken değişken anlamlı olmasa bile belirleme katsayısı artar. Ancak modelin daha az karmaşık olması ve yorumlanmasının daha kolay olması nedeniyle değişken sayısını en aza indirmeye çalışarak belirleme katsayısını en üst düzeye çıkarmak gerekir.

Bu sorunu çözmek için, bir regresyon modelinin uyum kalitesini ölçen, düzeltilmemiş katsayıdan farklı olarak modele eklenen her değişken için ceza uygulayan istatistiksel bir katsayı olan düzeltilmiş belirleme katsayısının (düzeltilmiş R kare) hesaplanması gerekir. kararlılık. bu, modeldeki değişkenlerin sayısını hesaba katmaz.

Böylece düzeltilmiş belirleme katsayısı, iki modelin uyum iyiliğini farklı sayıda değişkenle karşılaştırmamıza olanak tanır. Prensip olarak düzeltilmiş belirleme katsayısı daha yüksek olan model seçilmelidir, ancak iki model çok benzer değerlere sahipse yorumlanması daha kolay olduğundan daha az değişkenli modelin seçilmesi daha iyidir.

Buna karşılık, regresyon katsayıları açıklayıcı değişken ile yanıt değişkeni arasındaki ilişkiyi gösterir. Regresyon katsayısı pozitif ise açıklayıcı değişken arttıkça yanıt değişkeni de artacaktır. oysa regresyon katsayısı negatifse açıklayıcı değişken arttığında yanıt değişkeni azalacaktır.

Mantıksal olarak önceki koşulun sağlanması için diğer değişkenlerin sabit kalması gerekir. Bu nedenle modelin farklı açıklayıcı değişkenleri arasında çoklu bağlantı olmaması önemlidir. Web sitemizde ilgili makaleyi arayarak bir modelin çoklu doğrusallığının nasıl incelendiğini görebilirsiniz.

Çoklu ve basit doğrusal regresyon

Son olarak basit doğrusal regresyon modeli ile çoklu doğrusal regresyon modeli arasındaki farkların neler olduğunu göreceğiz çünkü bunlar istatistikte yaygın olarak kullanılan iki regresyon modelidir.

Basit doğrusal regresyon, bağımsız bir değişkeni ilişkilendirmek için kullanılan bir regresyon modelidir. Yani basit bir doğrusal regresyon modelinin denklemi aşağıdaki gibidir:

y=\beta_0+\beta_1x_1+\varepsilon

Bu nedenle çoklu doğrusal regresyon ile basit doğrusal regresyon arasındaki fark, açıklayıcı değişkenlerin sayısında yatmaktadır. Çoklu doğrusal regresyon modelinde iki veya daha fazla açıklayıcı değişken bulunurken, basit doğrusal regresyon modelinde yalnızca bir açıklayıcı değişken bulunur.

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

Sonuç olarak, çoklu doğrusal regresyon, basit doğrusal regresyonun bir uzantısıdır, çünkü daha fazla açıklayıcı değişken ve bunların ilgili regresyon katsayıları basitçe eklenir. Ancak regresyon katsayıları farklı şekilde hesaplanır; bunun nasıl yapıldığını görmek için buraya tıklayın:

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir