Excel'de ikinci dereceden regresyon nasıl gerçekleştirilir


Regresyon, bir veya daha fazla yordayıcı değişken ile bir yanıt değişkeni arasındaki ilişkiyi açıklamak için kullanabileceğimiz istatistiksel bir tekniktir. En yaygın regresyon türü, yordayıcı değişken ile yanıt değişkeni arasındaki ilişki doğrusal olduğunda kullandığımız doğrusal regresyondur .

Başka bir deyişle, yordayıcı değişken arttığında yanıt değişkeni de artma eğilimindedir. Örneğin, çalışılan saat sayısı (tahmin değişkeni) ile öğrencinin sınavda aldığı not (yanıt değişkeni) arasındaki ilişkiyi tanımlamak için doğrusal bir regresyon modeli kullanabiliriz.

Ancak bazen yordayıcı değişken ile yanıt değişkeni arasındaki ilişki doğrusal değildir . Doğrusal olmayan ilişkinin yaygın bir türü, grafikte U veya baş aşağı bir U gibi görünebilen ikinci dereceden ilişkidir .

Yani yordayıcı değişken arttıkça tepki değişkeni de artma eğiliminde olur ancak belli bir noktadan sonra yordayıcı değişken artmaya devam ettikçe yanıt değişkeni azalmaya başlar.

Örneğin, çalışarak geçirilen saat sayısı ile kişinin bildirilen mutluluk düzeyi arasındaki ilişkiyi tanımlamak için ikinci dereceden regresyon modelini kullanabiliriz. Belki bir kişi ne kadar çok çalışırsa o kadar tatmin olur, ancak belli bir eşiğe ulaştıktan sonra daha fazla çalışmak aslında strese ve mutluluğun azalmasına neden olur. Bu durumda, ikinci dereceden bir regresyon modeli, verilere doğrusal bir regresyon modelinden daha iyi uyum sağlayacaktır.

Excel’de ikinci dereceden regresyonun nasıl gerçekleştirileceğine ilişkin bir örneği inceleyelim.

Excel’de İkinci Dereceden Regresyon

16 farklı kişi için haftada çalışılan saat sayısına ve rapor edilen mutluluk düzeyine (0’dan 100’e kadar bir ölçekte) ilişkin verilerimiz olduğunu varsayalım:

Öncelikle doğrusal regresyonun verilere uymaya uygun bir model olup olmadığını görmek için bir dağılım grafiği oluşturalım.

A2:B17 hücrelerini vurgulayın. Daha sonra, üst şeritteki INSERT sekmesine tıklayın ve ardından Grafikler alanında Dağılım’a tıklayın. Bu, verilerin bir dağılım grafiğini oluşturacaktır:

Çalışılan saat ile bildirilen mutluluk arasındaki ilişkinin doğrusal olmadığını görmek kolaydır. Aslında “U” şeklini takip eder ve bu da onu ikinci dereceden regresyon için mükemmel bir aday yapar.

İkinci dereceden regresyon modelini verilere uyarlamadan önce, tahmin değişkenimizin karesi alınmış değerleri için yeni bir sütun oluşturmamız gerekiyor.

Öncelikle B sütunundaki tüm değerleri vurgulayın ve C sütununa sürükleyin.

Daha sonra B2 hücresine =A2^2 formülünü yazın. Bu, 36 değerini üretir. Daha sonra, B2 hücresinin sağ alt köşesine tıklayın ve B sütunundaki kalan hücreleri doldurmak için formülü aşağı sürükleyin.

Daha sonra ikinci dereceden regresyon modelini uygulayacağız.

Üst şeritte VERİ’ye tıklayın, ardından en sağdaki Veri Analizi seçeneğine tıklayın. Bu seçeneği görmüyorsanız, öncelikle ücretsiz Analysis ToolPak yazılımını yüklemelisiniz .

Veri Analizi’ne tıkladığınızda bir kutu görünecektir. Regresyon’u ve ardından Tamam’ı tıklayın.

Daha sonra karşınıza çıkan Regresyon kutusunda aşağıdaki değerleri doldurunuz. Daha sonra Tamam’ı tıklayın.

Aşağıdaki sonuçlar görüntülenecektir:

Çıktıdaki farklı sayıları nasıl yorumlayacağınız aşağıda açıklanmıştır:

R Kare: Belirleme katsayısı olarak da bilinen bu, yanıt değişkenindeki varyansın, yordayıcı değişkenler tarafından açıklanabilen oranıdır. Bu örnekte R kare 0,9092’dir ; bu, rapor edilen mutluluk seviyelerindeki varyansın %90,92’sinin çalışılan saat sayısı ve çalışılan saat sayısı^2 ile açıklanabileceğini gösterir.

Standart hata: Regresyonun standart hatası, gözlenen değerler ile regresyon çizgisi arasındaki ortalama mesafedir. Bu örnekte gözlemlenen değerler regresyon doğrusundan ortalama 9.519 birim sapmaktadır.

F-istatistiği : F-istatistiği, regresyon MS/artık MS olarak hesaplanır. Bu istatistik, regresyon modelinin bağımsız değişken içermeyen bir modele göre verilere daha iyi uyum sağlayıp sağlamadığını gösterir. Temel olarak regresyon modelinin bir bütün olarak yararlı olup olmadığını test eder. Genel olarak, modeldeki yordayıcı değişkenlerden hiçbiri istatistiksel olarak anlamlı değilse, genel F istatistiği de istatistiksel olarak anlamlı değildir. Bu örnekte F istatistiği 65,09’dur ve karşılık gelen p değeri <0,0001’dir. Bu p değeri 0,05’ten küçük olduğundan regresyon modeli bir bütün olarak anlamlıdır.

Regresyon katsayıları: Son tablodaki regresyon katsayıları bize tahmini regresyon denklemini yazmak için gereken sayıları verir:

y şapka = b 0 + b 1 x 1 + b 2 x 1 2

Bu örnekte tahmini regresyon denklemi şöyledir:

beyan edilen mutluluk düzeyi = -30,252 + 7,173 (Çalışılan saat) -0,106 (Çalışılan saat) 2

Bu denklemi, bireyin çalışma saatlerine göre beklenen mutluluk düzeyini hesaplamak için kullanabiliriz. Örneğin haftada 30 saat çalışan bir kişinin beklenen mutluluk düzeyi:

bildirilen mutluluk düzeyi = -30,252 + 7,173(30) -0,106(30) 2 = 88,649 .

Ek kaynaklar

Excel’de ikinci dereceden bir eğilim çizgisi nasıl eklenir
Regresyon Tablosu Nasıl Okunmalı ve Yorumlanmalı

İyi bir R-kare değeri nedir?
Regresyonun Standart Hatasını Anlamak
Regresyonda Genel Önemin F Testini Anlamak İçin Basit Bir Kılavuz

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir