Doğrusal regresyon

Bu makalede doğrusal regresyonun ne olduğu ve istatistikte ne için kullanıldığı açıklanmaktadır. Ek olarak, iki tür doğrusal regresyonun nasıl hesaplandığını görebileceksiniz: basit doğrusal regresyon ve çoklu doğrusal regresyon.

Doğrusal regresyon nedir?

Doğrusal regresyon, bir veya daha fazla bağımsız değişkeni bağımlı bir değişkenle ilişkilendiren istatistiksel bir modeldir. Basitçe söylemek gerekirse, doğrusal regresyon, bir veya daha fazla açıklayıcı değişken ile bir yanıt değişkeni arasındaki ilişkiye yaklaşan bir denklem bulmak için kullanılan bir tekniktir.

Örneğin, y=2+5x 1 -3x 2 +8x 3 denklemi doğrusal bir regresyon modelidir çünkü üç bağımsız değişkeni (x 1 , x 2 , x 3 ) bir bağımlı değişkenle (y) matematiksel olarak ilişkilendirir ve ayrıca, değişkenler arasındaki ilişki doğrusaldır.

Doğrusal Regresyon Türleri

İki tür doğrusal regresyon vardır:

  • Basit doğrusal regresyon : Tek bir bağımsız değişken, bağımlı bir değişkene bağlanır. Dolayısıyla bu tür doğrusal regresyon modelinin denklemi y=β 01 x 1 biçimindedir.
  • Çoklu doğrusal regresyon : Regresyon modelinde birkaç açıklayıcı değişken ve bir yanıt değişkeni bulunur. Bu nedenle, bu tür doğrusal regresyon modelinin denklemi şu şekildedir: y=β 01 x 12 x 2 …+β m x m .

basit doğrusal regresyon

Basit doğrusal regresyon, bir bağımsız değişkeni her iki değişkenle ilişkilendirmek için kullanılır.

Basit bir doğrusal regresyon modelinin denklemi düz bir çizgidir, dolayısıyla iki katsayıdan oluşur: denklemin sabiti (β 0 ) ve iki değişken arasındaki korelasyon katsayısı (β 1 ). Bu nedenle, basit bir doğrusal regresyon modelinin denklemi y=β 01 x’tir.

y=\beta_0+\beta_1x

Basit doğrusal regresyon katsayılarını hesaplamak için formüller aşağıdaki gibidir:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

Altın:

  • \beta_0

    regresyon çizgisinin sabitidir.

  • \beta_1

    regresyon çizgisinin eğimidir.

  • x_i

    i verisinin bağımsız değişkeni X’in değeridir.

  • y_i

    i verisinin bağımlı değişkeni Y’nin değeridir.

  • \overline{x}

    bağımsız değişkenin değerlerinin ortalamasıdır

  • \overline{y}

    bağımlı değişken Y’nin değerlerinin ortalamasıdır.

Çoklu doğrusal gerileme

Çoklu doğrusal regresyon modelinde en az iki bağımsız değişken yer alır. Başka bir deyişle, çoklu doğrusal regresyon, birçok açıklayıcı değişkenin bir yanıt değişkenine doğrusal olarak bağlanmasına olanak tanır.

Çoklu doğrusal regresyon modelinin denklemi şöyledir: y=β 01 x 12 x 2 +…+β m x m +ε.

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

Altın:

  • y

    bağımlı değişkendir.

  • x_i

    bağımsız değişken i’dir.

  • \beta_0

    çoklu doğrusal regresyon denkleminin sabitidir.

  • \beta_i

    değişkenle ilişkili regresyon katsayısıdır

    x_i

    .

  • \bm{\varepsilon}

    hata veya artıktır, yani gözlemlenen değer ile model tarafından tahmin edilen değer arasındaki farktır.

  • m

    modeldeki değişkenlerin toplam sayısıdır.

Toplamda bir örneğimiz varsa

n

gözlemlere dayanarak çoklu doğrusal regresyon modelini matris biçiminde ortaya koyabiliriz:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

Yukarıdaki matris ifadesi, her matrise bir harf atanarak yeniden yazılabilir:

Y=X\beta+\varepsilon

Böylece, en küçük kareler kriterini uygulayarak çoklu doğrusal regresyon modelinin katsayılarını tahmin etmek için formüle ulaşabiliriz:

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

Ancak bu formülün uygulanması çok zahmetli ve zaman alıcıdır, bu nedenle pratikte çoklu regresyon modelinin çok daha hızlı oluşturulmasına olanak tanıyan bilgisayar yazılımlarının (Minitab veya Excel gibi) kullanılması tavsiye edilir.

Doğrusal Regresyon Varsayımları

Doğrusal regresyon modelinde modelin geçerli olabilmesi için aşağıdaki koşulların karşılanması gerekir:

  • Bağımsızlık : Kalıntılar birbirinden bağımsız olmalıdır. Model bağımsızlığını sağlamanın yaygın bir yolu örnekleme sürecine rastgelelik eklemektir.
  • Homoskedastisite : Artıkların varyanslarında homojenlik olmalı, yani artıkların değişkenliği sabit olmalıdır.
  • Çoklu doğrusal olmama : Modelde yer alan açıklayıcı değişkenlerin birbirine bağlanamaması veya en azından ilişkilerinin çok zayıf olması gerekir.
  • Normallik : Artıkların normal dağılması veya başka bir deyişle ortalaması 0 olan normal dağılıma uyması gerekir.
  • Doğrusallık : Yanıt değişkeni ile açıklayıcı değişkenler arasındaki ilişkinin doğrusal olduğu varsayılmaktadır.

Doğrusal regresyon ne için kullanılır?

Doğrusal regresyonun temel olarak iki kullanımı vardır: Açıklayıcı değişkenler ile yanıt değişkeni arasındaki ilişkiyi açıklamak için doğrusal regresyon kullanılır ve benzer şekilde, yeni bir gözlem için bağımlı değişkenin değerini tahmin etmek için doğrusal regresyon kullanılır.

Doğrusal regresyon modelinin denklemini elde ederek modeldeki değişkenler arasında ne tür bir ilişkinin bulunduğunu bilebiliriz. Bir bağımsız değişkenin regresyon katsayısı pozitif ise bağımlı değişken arttığında artacaktır. oysa bağımsız bir değişkenin regresyon katsayısı negatifse bağımlı değişken arttığında azalacaktır.

Öte yandan doğrusal regresyonda hesaplanan denklem aynı zamanda değer tahminleri yapılmasına da olanak sağlar. Böylece açıklayıcı değişkenlerin değerlerini model denklemine dahil ederek yeni bir veri parçası için bağımlı değişkenin değerini hesaplayabiliriz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir