Regresyon denklemi

Bu makalede regresyon denkleminin ne olduğu ve ne için kullanıldığı açıklanmaktadır. Benzer şekilde, bir regresyon denklemini nasıl bulacağınızı, çözülmüş bir alıştırmayı ve son olarak herhangi bir veri seti için regresyon denklemini hesaplamak için çevrimiçi bir hesap makinesini nasıl bulacağınızı öğreneceksiniz.

Regresyon denklemi nedir?

Regresyon denklemi nokta grafiğine en iyi uyan denklemdir, yani regresyon denklemi bir veri kümesinin en iyi yaklaşımıdır.

Regresyon denklemi y=β 01 x formundadır; burada β 0 denklemin sabiti ve β 1 denklemin eğimidir.

y=\beta_0+\beta_1x

Regresyon denklemine bakarsanız, bu bir doğrunun denklemidir. Bu, çizgi doğrusal bir ilişkiyi temsil ettiğinden bağımsız değişken X ile bağımlı değişken Y arasındaki ilişkinin doğrusal bir ilişki olarak modellendiği anlamına gelir.

Böylece regresyon denklemi, bir veri setinin bağımsız değişkeni ile bağımlı değişkenini matematiksel olarak ilişkilendirmemize olanak tanır. Regresyon denklemi genellikle her gözlemin değerini kesin olarak belirleme yeteneğine sahip olmasa da yine de değerinin yaklaşık bir değerini elde etmek için kullanılır.

regresyon denklemi

Önceki grafikte görebileceğiniz gibi regresyon denklemi, bir veri setinin eğilimini ve bağımsız değişken ile bağımlı değişken arasında ne tür bir ilişkinin bulunduğunu görmemize yardımcı olur.

Regresyon denklemi nasıl hesaplanır

Basit doğrusal regresyon denkleminin katsayılarını hesaplamak için formüller aşağıdaki gibidir:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

Altın:

  • \beta_0

    regresyon denkleminin sabitidir.

  • \beta_1

    regresyon denkleminin eğimidir.

  • x_i

    i verisinin bağımsız değişkeni X’in değeridir.

  • y_i

    i verisinin bağımlı değişkeni Y’nin değeridir.

  • \overline{x}

    bağımsız değişkenin değerlerinin ortalamasıdır

  • \overline{y}

    bağımlı değişken Y’nin değerlerinin ortalamasıdır.

Regresyon denklemini hesaplama örneği

  • İstatistik sınavına girdikten sonra beş öğrenciye sınava kaç saat ders çalıştıkları soruldu, veriler aşağıdaki tabloda gösterildi. Çalışma saatlerini alınan notla doğrusal olarak ilişkilendirmek için toplanan istatistiksel verilerden regresyon denklemini hesaplayın. Daha sonra 8 saat ders çalışan öğrencinin hangi notu alacağını belirleyin.

Örnek verilere ilişkin regresyon denklemini bulmak için denklemin b 0 ve b 1 katsayılarını belirlememiz ve bunun için yukarıdaki bölümde görülen formülleri kullanmamız gerekir.

Ancak doğrusal regresyon denkleminin formüllerini uygulamak için öncelikle bağımsız değişkenin ortalamasını ve bağımlı değişkenin ortalamasını hesaplamamız gerekir:

\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}

Artık değişkenlerin ortalamasını bildiğimize göre, ilgili formülü kullanarak modelin β 1 katsayısını hesaplıyoruz:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] \beta_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]\beta_1=0,4412\end{array}

Son olarak, ilgili formülü kullanarak modelin β 0 katsayısını hesaplıyoruz:

\begin{array}{l}\beta_0=\overline{y}-\beta_1\overline{x}\\[3ex]\beta_0=6-0,4412\cdot 9 \\[3ex]\beta_0=2,0294\end{array}

Kısaca problemin doğrusal regresyon çizgisinin denklemi aşağıdaki gibidir:

y=2,0294+0,4412x

Aşağıda basit doğrusal regresyon modeli denklemiyle birlikte örnek verilerin grafiksel gösterimini görebilirsiniz:

doğrusal regresyon çizgisi örneği

Regresyon denklemini hesapladıktan sonra, 8 saat ders çalışan bir öğrencinin alacağı notu tahmin etmek için bu değeri elde edilen regresyon denkleminde yerine koymanız yeterlidir:

y=2,0294+0,4412\cdot 8=5,56

Böylece gerçekleştirilen doğrusal regresyon modeline göre bir öğrenci sekiz saat ders çalışırsa sınavdan 5,56 puan alacaktır.

Regresyon denklemi hesaplayıcısı

Regresyon denkleminizi hesaplamak için aşağıdaki hesap makinesine örnek bir veri ekleyin. Veri çiftlerini ayırmanız gerekir, böylece ilk kutuda yalnızca bağımsız değişken X’in değerleri bulunur ve ikinci kutuda yalnızca bağımlı değişken Y’nin değerleri bulunur.

Veriler bir boşlukla ayrılmalı ve ondalık ayırıcı olarak nokta kullanılarak girilmelidir.

  • Bağımsız değişken

  • Bağımlı değişken Y:

Çoklu doğrusal regresyon denklemi

Basit doğrusal regresyon denkleminin ne olduğunu az önce gördük, ancak regresyon modeli aynı zamanda iki veya daha fazla bağımsız değişken içeren çoklu doğrusal regresyon modeli de olabilir. Böylece çoklu doğrusal regresyon, birçok açıklayıcı değişkenin bir yanıt değişkenine doğrusal olarak bağlanmasını mümkün kılar.

Çoklu doğrusal regresyon modelinin denklemi şöyledir:

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

Altın:

  • y

    bağımlı değişkendir.

  • x_i

    bağımsız değişken i’dir.

  • \beta_0

    çoklu doğrusal regresyon denkleminin sabitidir.

  • \beta_i

    değişkenle ilişkili regresyon katsayısıdır

    x_i

    .

  • \bm{\varepsilon}

    hata veya artıktır, yani gözlemlenen değer ile model tarafından tahmin edilen değer arasındaki farktır.

  • m

    modeldeki değişkenlerin toplam sayısıdır.

Toplamda bir örneğimiz varsa

n

gözlemlere dayanarak çoklu doğrusal regresyon modelini matris biçiminde ortaya koyabiliriz:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

Yukarıdaki matris ifadesi, her matrise bir harf atanarak yeniden yazılabilir:

Y=X\beta+\varepsilon

Böylece, en küçük kareler kriterini uygulayarak çoklu doğrusal regresyon denkleminin katsayılarını tahmin etmek için formüle ulaşabiliriz:

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

Ancak bu formülün uygulanması çok zahmetli ve zaman alıcıdır, bu nedenle pratikte çoklu regresyon modelinin çok daha hızlı oluşturulmasına olanak tanıyan bilgisayar yazılımlarının (Minitab veya Excel gibi) kullanılması tavsiye edilir.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir