Düzeltilmiş r-kare nasıl yorumlanır (örneklerle)


Doğrusal regresyon modellerini yerleştirirken sıklıkla modelin R-kare değerini hesaplarız.

R-kare değeri, yanıt değişkenindeki varyansın, modeldeki yordayıcı değişkenler tarafından açıklanabilen oranıdır.

R karenin değeri 0 ila 1 arasında değişebilir; burada:

  • 0 değeri, yanıt değişkeninin yordayıcı değişkenler tarafından hiçbir şekilde açıklanamayacağını gösterir.
  • 1 değeri, yanıt değişkeninin yordayıcı değişkenler tarafından mükemmel bir şekilde açıklanabildiğini gösterir.

Bu metrik, bir regresyon modelinin bir veri kümesine ne kadar iyi uyduğunu değerlendirmek için yaygın olarak kullanılsa da ciddi bir dezavantajı vardır:

R-karenin dezavantajı:

Regresyon modeline yeni bir yordayıcı değişken eklendiğinde R-kare her zaman artacaktır.

Yeni bir yordayıcı değişkenin yanıt değişkeniyle neredeyse hiç ilişkisi olmasa bile, modelin R-kare değeri küçük bir miktar da olsa artacaktır.

Bu nedenle çok sayıda yordayıcı değişkene sahip bir regresyon modelinin, model verilere tam olarak uymasa bile yüksek bir R-kare değerine sahip olması mümkündür.

Neyse ki, R-squared’in düzeltilmiş R-squared adı verilen bir alternatifi var.

Düzeltilmiş R-kare, bir regresyon modelindeki öngörücülerin sayısını ayarlayan, R-karenin değiştirilmiş bir versiyonudur.

Aşağıdaki şekilde hesaplanır:

Düzeltilmiş R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]

Altın:

  • R 2 : Modelin R 2’si
  • n : Gözlem sayısı
  • k : Tahmin değişkenlerinin sayısı

Bir modele öngörücüler ekledikçe R-kare her zaman arttığından, düzeltilmiş R-kare , bir modeldeki öngörücülerin sayısına göre ayarlandığında , bir modelin ne kadar kullanışlı olduğunu size söyleyebilir.

Düzeltilmiş R-karenin avantajı:

Düzeltilmiş R-kare bize, bir dizi yordayıcı değişkenin, bir modeldeki yordayıcıların sayısına göre ayarlanan yanıt değişkenindeki değişimi ne kadar iyi açıklayabildiğini söyler.

Hesaplanma şekli nedeniyle düzeltilmiş R-kare, regresyon modellerinin uyumunu farklı sayıda öngörücü değişkenle karşılaştırmak için kullanılabilir.

Düzeltilmiş R-kareyi daha iyi anlamak için aşağıdaki örneğe bakın.

Örnek: Regresyon Modellerinde Düzeltilmiş R-kareyi Anlamak

Bir profesörün sınıfındaki öğrenciler hakkında veri topladığını ve ders çalışmak için harcanan saatlerin ve sınıftaki mevcut notun öğrencinin final sınavında aldığı notu nasıl etkilediğini anlamak için aşağıdaki regresyon modeline uyduğunu varsayalım.

Sınav puanı = β 0 + β 1 (harcanan ders saati) + β 2 (mevcut not)

Bu regresyon modelinin aşağıdaki ölçümlere sahip olduğunu varsayalım:

  • R kare: 0,955
  • Düzeltilmiş R-kare: 0,946

Şimdi öğretmenin her öğrenci için başka bir değişkene ilişkin veri toplamaya karar verdiğini varsayalım: ayakkabı numarası.

Bu değişkenin final sınavı notuyla hiçbir ilişkisi olmamasına rağmen aşağıdaki regresyon modelini uyarlamaya karar verir:

Sınav puanı = β 0 + β 1 (çalışma için harcanan saat) + β 2 (cari yıl) + β 3 (ayakkabı numarası)

Bu regresyon modelinin aşağıdaki ölçümlere sahip olduğunu varsayalım:

  • R kare: 0,965
  • Düzeltilmiş R-kare: 0,902

Bu iki regresyon modelinin her biri için yalnızca R-kare değerlerine baksaydık, R-kare değeri daha yüksek olduğu için ikinci modelin kullanılmasının daha iyi olduğu sonucuna varırdık!

Ancak düzeltilmiş R-kare değerlerine bakarsak farklı bir sonuca varırız: birinci modeli kullanmak daha iyidir çünkü düzeltilmiş R-kare değeri daha yüksektir.

İkinci model, birinci modele göre daha fazla yordayıcı değişkene sahip olduğundan yalnızca daha yüksek bir R-kare değerine sahiptir.

Ancak eklediğimiz yordayıcı değişken (ayakkabı numarası) final sınav puanının zayıf bir yordayıcısıydı, bu nedenle düzeltilmiş R-kare değeri, bu yordayıcı değişkeni eklediği için modeli cezalandırdı.

Bu örnek, regresyon modellerinin uyumunu farklı sayıda öngörücü değişkenle karşılaştırırken düzeltilmiş R-karenin neden daha iyi bir ölçüm olduğunu göstermektedir.

Ek kaynaklar

Aşağıdaki eğitimlerde, farklı istatistiksel yazılımlar kullanılarak düzeltilmiş R-kare değerlerinin nasıl hesaplanacağı açıklanmaktadır:

R’de düzeltilmiş R-kare nasıl hesaplanır
Excel’de düzeltilmiş R-kare nasıl hesaplanır
Python’da düzeltilmiş R-kare nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir