R çoklu veya r kare: fark nedir?
Çoğu istatistiksel yazılımı kullanarak bir regresyon modelini uydurduğunuzda, sonuçta genellikle aşağıdaki iki değeri fark edeceksiniz:
Çoklu R: Üç veya daha fazla değişken arasındaki çoklu korelasyon katsayısı.
R-Kare: (Çoklu R) 2 olarak hesaplanır ve bir regresyon modelinin yanıt değişkenindeki yordayıcı değişkenler tarafından açıklanabilen varyansın oranını temsil eder. Bu değer 0 ile 1 arasında değişmektedir.
Pratikte R-kare değeriyle sıklıkla ilgileniriz çünkü bu bize yordayıcı değişkenlerin yanıt değişkeninin değerini tahmin etmede ne kadar yararlı olduğunu anlatır.
Ancak modele her yeni yordayıcı değişken eklediğimizde, yordayıcı değişken kullanışlı olmasa bile R-karenin artması garanti edilir.
Düzeltilmiş R-kare, bir regresyon modelindeki öngörücülerin sayısını ayarlayan, R-karenin değiştirilmiş bir versiyonudur. Aşağıdaki şekilde hesaplanır:
Düzeltilmiş R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]
Altın:
- R 2 : Modelin R 2’si
- n : Gözlem sayısı
- k : Tahmin değişkenlerinin sayısı
Bir modele daha fazla öngörücü ekledikçe R-kare her zaman arttığından, düzeltilmiş R-kare , bir modeldeki öngörücülerin sayısına göre ayarlanarak , bir modelin ne kadar yararlı olduğunu söyleyen bir ölçüm görevi görebilir.
Bu terimlerin her birini daha iyi anlamak için aşağıdaki örneği inceleyin.
Örnek: Çoklu R, R-kare ve düzeltilmiş R-kare
12 farklı öğrenci için aşağıdaki üç değişkeni içeren aşağıdaki veri setine sahip olduğumuzu varsayalım:
Tahmin edici değişkenler olarak çalışma saatlerini ve mevcut notu ve yanıt değişkeni olarak sınav puanını kullanarak çoklu doğrusal regresyon modeli uyguladığımızı ve aşağıdaki sonucu elde ettiğimizi varsayalım:
Aşağıdaki üç metriğin değerlerini gözlemleyebiliriz:
Çoklu R: 0,978 . Bu, yanıt değişkeni ile iki yordayıcı değişken arasındaki çoklu korelasyonu temsil eder.
R Kare: 0,956 . Bu, (Çoklu R) 2 = (0,978) 2 = 0,956 olarak hesaplanır. Bu bize, sınav puanlarındaki farklılığın %95,6’sının öğrencilerin ders çalışmak için harcadıkları saat sayısı ve dersteki mevcut notlarıyla açıklanabileceğini söylüyor.
Düzeltilmiş R-kare: 0,946 . Bu şu şekilde hesaplanır:
Düzeltilmiş R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)] = 1 – [(1-.956)*(12-1)/(12-2-1) ] = 0,946.
Bu, modeldeki öngörücü değişkenlerin sayısına göre ayarlanan R-kare değerini temsil eder.
Bu ölçüm, örneğin başka bir regresyon modelini 10 öngörücüyle eşleştirirsek ve bu modelin düzeltilmiş R-karesinin 0,88 olduğunu bulursak faydalı olacaktır. Bu, yalnızca iki öngörücüye sahip regresyon modelinin daha yüksek düzeltilmiş R kare değerine sahip olması nedeniyle daha iyi olduğunu gösterir.
Ek kaynaklar
Çoklu Doğrusal Regresyona Giriş
İyi bir R-kare değeri nedir?