Regresyon analizi
Bu makalede regresyon analizinin ne olduğu ve istatistikte ne için kullanıldığı açıklanmaktadır. Ek olarak, farklı regresyon analizi türlerinin neler olduğunu görebileceksiniz.
Regresyon analizi nedir?
İstatistikte regresyon analizi , iki veya daha fazla değişken arasındaki ilişkinin incelendiği bir süreçtir. Daha spesifik olarak regresyon analizi, çalışmadaki değişkenleri matematiksel olarak ilişkilendiren bir denklemin hesaplanmasını içerir.
Regresyon analizinde oluşturulan modele regresyon modeli, incelenen değişkenleri ilişkilendiren denkleme ise regresyon denklemi denir.
Örneğin bir ülkenin enflasyonu ile GSYH arasındaki ilişkiyi incelemek istiyorsanız iki değişken arasındaki ilişkiyi analiz etmek için regresyon analizi yapabilirsiniz. Bu durumda regresyon analizinden elde edilen denklem bir regresyon doğrusu olacaktır.
Dolayısıyla bir regresyon analizi, bir veri örneğinin toplanmasından oluşur ve toplanan verilerden, incelenen değişkenlerin matematiksel olarak ilişkilendirilmesine olanak tanıyan bir denklem hesaplanır.
Regresyon analizlerinde, regresyon modeline dahil edilebilecek iki tür değişken arasında ayrım yapmak önemlidir:
- Bağımlı değişken (veya tepki değişkeni) : analiz etmek istediğimiz faktör budur, dolayısıyla bu değişkenin değerinin diğer değişkenlerin değerine bağlı olarak nasıl değiştiğini görmek için bir regresyon modeli oluşturulacaktır.
- Bağımsız değişken (veya açıklayıcı değişken) : Analiz etmek istediğimiz değişkeni etkileyebileceğini düşündüğümüz bir faktördür. Yani bağımsız değişkenin değeri bağımlı değişkenin değerini etkiler.
Regresyon Analizi Türleri
Temel olarak üç tür regresyon analizi vardır:
- Basit Doğrusal Regresyon Analizi : Regresyon modelinde bir bağımsız değişken bir de bağımlı değişken bulunur ve bunlar doğrusal olarak ilişkilidir.
- Çoklu doğrusal regresyon analizi : iki veya daha fazla bağımsız değişkenin bir bağımlı değişkenle doğrusal olarak ilişkili olması.
- Doğrusal olmayan regresyon analizi : Bağımsız değişken ile bağımlı değişken arasındaki ilişki, doğrusal olmayan bir fonksiyon kullanılarak modellenir.
Basit doğrusal regresyon analizi
Basit doğrusal regresyon, bağımsız bir değişkeni doğrusal bir denklem kullanarak her iki değişkenle ilişkilendirmek için kullanılır.
Basit bir doğrusal regresyon modelinin denklemi düz bir çizgidir, dolayısıyla iki katsayıdan oluşur: denklemin sabiti (β 0 ) ve iki değişken arasındaki korelasyon katsayısı (β 1 ). Bu nedenle, basit bir doğrusal regresyon modelinin denklemi y=β 0 +β 1 x’tir.
Basit doğrusal regresyonun katsayılarını hesaplamak için formüller aşağıdaki gibidir:
Altın:
-
regresyon çizgisinin sabitidir.
-
regresyon çizgisinin eğimidir.
-
i verisinin bağımsız değişkeni X’in değeridir.
-
i verisinin bağımlı değişkeni Y’nin değeridir.
-
bağımsız değişkenin değerlerinin ortalamasıdır
-
bağımlı değişken Y’nin değerlerinin ortalamasıdır.
Çoklu doğrusal regresyon analizi
Çoklu doğrusal regresyon modelinde en az iki bağımsız değişken yer alır. Başka bir deyişle, çoklu doğrusal regresyon, birçok açıklayıcı değişkenin bir yanıt değişkenine doğrusal olarak bağlanmasına olanak tanır. Bu nedenle çoklu doğrusal regresyon modelinin denklemi şu şekildedir:
Altın:
-
bağımlı değişkendir.
-
bağımsız değişken i’dir.
-
çoklu doğrusal regresyon denkleminin sabitidir.
-
değişkenle ilişkili regresyon katsayısıdır
.
-
hata veya artıktır, yani gözlemlenen değer ile model tarafından tahmin edilen değer arasındaki farktır.
-
modeldeki değişkenlerin toplam sayısıdır.
Toplamda bir örneğimiz varsa
gözlemlere dayanarak çoklu doğrusal regresyon modelini matris biçiminde ortaya koyabiliriz:
Yukarıdaki matris ifadesi, her matrise bir harf atanarak yeniden yazılabilir:
Böylece, en küçük kareler kriterini uygulayarak çoklu doğrusal regresyon modelinin katsayılarını tahmin etmek için formüle ulaşabiliriz:
Ancak bu formülün uygulanması çok zahmetli ve zaman alıcıdır, bu nedenle pratikte çoklu regresyon modelinin çok daha hızlı oluşturulmasına olanak tanıyan bilgisayar yazılımlarının (Minitab veya Excel gibi) kullanılması tavsiye edilir.
Doğrusal olmayan regresyon analizi
İstatistikte doğrusal olmayan regresyon , regresyon denkleminin modeli olarak doğrusal olmayan bir fonksiyonun kullanıldığı bir regresyon türüdür. Bu nedenle doğrusal olmayan bir regresyon modelinin denklemi doğrusal olmayan bir fonksiyondur.
Mantıksal olarak, iki değişken arasındaki ilişki doğrusal olmadığında bağımsız değişkeni bağımlı değişkenle ilişkilendirmek için doğrusal olmayan regresyon kullanılır. Dolayısıyla, örnek verilerin grafiğini çizerken bunların doğrusal bir ilişkiye sahip olmadığını, yani yaklaşık olarak düz bir çizgi oluşturmadığını gözlemlersek, ‘doğrusal olmayan bir regresyon modeli kullanmak’ daha iyidir.
Örneğin, y=3-5x-8x 2 +x 3 denklemi doğrusal olmayan bir regresyon modelidir çünkü bağımsız değişken X’i kübik bir fonksiyon aracılığıyla matematiksel olarak bağımlı değişken Y ile ilişkilendirir.
Temel olarak üç tür doğrusal olmayan regresyon vardır:
- Polinom Regresyon – Denklemi polinom biçiminde olan doğrusal olmayan regresyon.
- Logaritmik Regresyon – Bağımsız değişkenin logaritmik hale getirildiği doğrusal olmayan regresyon.
- Üstel Regresyon – Bağımsız değişkenin denklemin üssünde bulunduğu doğrusal olmayan regresyon.
Regresyon analizi ne için kullanılır?
Regresyon analizinin temel olarak iki kullanımı vardır: Regresyon analizi, açıklayıcı değişkenler ile yanıt değişkeni arasındaki ilişkiyi açıklamak için kullanılır ve benzer şekilde, regresyon analizi, yeni bir gözlem için bağımlı değişkenin değerini tahmin etmek için kullanılır.
Regresyon modelinin denklemini elde ederek modeldeki değişkenler arasında ne tür bir ilişkinin bulunduğunu bilebiliriz. Bir bağımsız değişkenin regresyon katsayısı pozitif ise bağımlı değişken arttığında artacaktır. oysa bağımsız bir değişkenin regresyon katsayısı negatifse bağımlı değişken arttığında azalacaktır.
Öte yandan regresyon analizinden elde edilen matematiksel denklem aynı zamanda değer tahminleri yapmamıza da olanak sağlar. Böylece açıklayıcı değişkenlerin değerlerini regresyon modelinin denklemine dahil ederek yeni bir veri parçası için bağımlı değişkenin değerini hesaplayabiliriz.