Polinom regresyonunu ne zaman kullanmalısınız?
Polinom regresyon, yordayıcı değişken(ler) ile yanıt değişkeni arasındaki ilişki doğrusal olmadığında bir regresyon modeline uymak için kullanabileceğimiz bir tekniktir.
Bir polinom regresyon modeli aşağıdaki formu alır:
Y = β 0 + β 1 X + β 2 X 2 + … + β h
Pratikte, doğrusal regresyon gibi daha basit bir model yerine polinom regresyonunu mu kullanmanız gerektiğini belirlemenin üç basit yolu vardır.
1. Tahmin değişkeninin ve yanıt değişkeninin dağılım grafiğini oluşturun
Polinom regresyonunu kullanmanız gerekip gerekmediğini belirlemenin en kolay yolu, tahmin değişkeni ve yanıt değişkeninin basit bir dağılım grafiğini oluşturmaktır.
Örneğin, bir öğrencinin final sınavında alacağı notu tahmin etmek için “çalışma saatleri” tahmin değişkenini kullanmak istediğimizi varsayalım.
Bir regresyon modeli yerleştirmeden önce, ilk olarak sınav sonuçlarına göre çalışılan saatlerin dağılım grafiğini oluşturabiliriz. Dağılım grafiğimizin şöyle göründüğünü varsayalım:
Çalışılan saatlerle sınav sonuçları arasındaki ilişki doğrusal görünmektedir, bu nedenle bu veri setine basit bir doğrusal regresyon modeli uydurmak mantıklı olacaktır.
Ancak dağılım grafiğinin aslında aşağıdaki gibi göründüğünü varsayalım:
Bu ilişki biraz daha doğrusal olmayan bir ilişki gibi görünüyor, bu da bize bunun yerine polinom regresyon modelini yerleştirmenin akıllıca olabileceğini söylüyor.
2. Takılan ve kalan değerlerin grafiğini oluşturun
Polinom regresyonunu kullanmanız gerekip gerekmediğini belirlemenin başka bir yolu, veri setine doğrusal bir regresyon modeli sığdırmak ve ardından model için artıklara karşı uydurulmuş değerlerin bir grafiğini oluşturmaktır.
Artıklarda net bir doğrusal olmayan eğilim varsa bu, polinom regresyonunun verilere daha iyi uyum sağlayabileceğini gösterir.
Örneğin, yordayıcı değişken olarak çalışılan saatleri ve yanıt değişkeni olarak sınav puanını kullanarak doğrusal bir regresyon modeli uyguladığımızı ve ardından artıklara karşı uydurulmuş değerlerin aşağıdaki grafiğini oluşturduğumuzu varsayalım:
Artıklar, net bir model olmadan sıfır etrafında rastgele dağılmıştır; bu, doğrusal bir modelin verilere uygun bir uyum sağladığını gösterir.
Ancak, uydurulmuş değerlerin artıklara karşı grafiğinin aslında aşağıdaki gibi göründüğünü varsayalım:
Grafikten, artıklarda net bir doğrusal olmayan model olduğunu görebiliriz; artıklar bir “U” şekli sergiler.
Bu bize, bu belirli veri için doğrusal bir modelin uygun olmadığını ve bunun yerine polinom regresyon modelinin uygulanmasının akıllıca olabileceğini söyler.
3. Modelin düzeltilmiş R-kare değerini hesaplayın
Polinom regresyonunu kullanmanız gerekip gerekmediğini belirlemenin başka bir yolu da hem doğrusal regresyon modelini hem de polinom regresyon modelini sığdırmak ve her iki model için uygun R-kare değerlerini hesaplamaktır.
Düzeltilmiş R-kare, modeldeki yordayıcı değişkenlerin sayısına göre ayarlanan , yanıt değişkenindeki modeldeki yordayıcı değişkenler tarafından açıklanabilen varyansın oranını temsil eder.
En yüksek düzeltilmiş R karesine sahip model, yanıt değişkenindeki değişimi açıklamak için yordayıcı değişken(ler)i en iyi şekilde kullanabilen modeli temsil eder.
Ek kaynaklar
Aşağıdaki eğitimlerde farklı istatistiksel yazılımlar kullanılarak polinom regresyonunun nasıl gerçekleştirileceği açıklanmaktadır:
Polinom Regresyona Giriş
R’de polinom regresyonu nasıl gerçekleştirilir
Python’da polinom regresyonu nasıl gerçekleştirilir
Excel’de Polinom Regresyon Nasıl Gerçekleştirilir