İyi bir r-kare değeri nedir?


R-kare, doğrusal bir regresyon modelinin bir veri kümesine ne kadar iyi “uyduğunu” ölçer. Yaygın olarak belirleme katsayısı olarak da adlandırılan R-kare, yordayıcı değişken tarafından açıklanabilen yanıt değişkenindeki varyansın oranıdır.

R-kare değeri 0 ila 1 arasında değişebilir. 0 değeri, yanıt değişkeninin yordayıcı değişken tarafından hiçbir şekilde açıklanamayacağını gösterir. 1 değeri, yanıt değişkeninin yordayıcı değişken tarafından hatasız olarak mükemmel bir şekilde açıklanabileceğini gösterir.

Pratikte muhtemelen R-kare için 0 veya 1 değerini hiçbir zaman görmeyeceksiniz. Bunun yerine muhtemelen 0 ile 1 arasında bir değerle karşılaşacaksınız.

Örneğin 30 farklı şehirdeki çiçekçilerin nüfus büyüklüğünü ve sayısını içeren bir veri kümeniz olduğunu varsayalım. Tahmin edici değişken olarak popülasyon boyutunu ve yanıt değişkeni olarak çiçekçileri kullanarak veri setine basit bir doğrusal regresyon modeli yerleştirirsiniz. Regresyon sonuçlarının sonucunda R 2 = 0,2 olduğunu görüyorsunuz. Bu da çiçekçi sayısındaki farklılığın %20’sinin popülasyon büyüklüğü ile açıklanabileceğini göstermektedir.

Bu bizi önemli bir soruya getiriyor: Bu R-kare için “iyi” bir değer mi?

Bu sorunun cevabı regresyon modeli hedefinize bağlıdır. Bilmek:

1. Yordayıcı(lar) ile yanıt değişkeni arasındaki ilişkiyi açıklamak ister misiniz?

ALTIN

2. Yanıt değişkenini tahmin etmek istiyor musunuz?

Amaca bağlı olarak “R kare için iyi bir değer nedir?” sorusunun cevabı. ” farklı olacak.

Tahminci(ler) ile yanıt değişkeni arasındaki ilişkiyi açıklayın

Regresyon modeliniz için birincil hedefiniz, öngörücü(ler) ile yanıt değişkeni arasındaki ilişkiyi açıklamaksa, R-kare neredeyse önemsizdir.

Örneğin yukarıdaki regresyon örneğinde, tahmini nüfus büyüklüğü katsayısının 0,005 olduğunu ve istatistiksel olarak anlamlı olduğunu gördüğünüzü varsayalım. Bu, nüfustaki bir artışın, belirli bir şehirdeki çiçekçi sayısında ortalama 0,005’lik bir artışla ilişkili olduğu anlamına gelir. Ayrıca nüfus büyüklüğü bir şehirdeki çiçekçi sayısının istatistiksel olarak anlamlı bir göstergesidir.

Bu regresyon modelinin R-kare değerinin 0,2 ya da 0,9 olması bu yorumu değiştirmez. Sadece popülasyon büyüklüğü ile çiçekçi sayısı arasındaki ilişkiyle ilgilendiğiniz için modelin R-kare değeri konusunda çok fazla endişelenmenize gerek yok.

Yanıt değişkenini tahmin edin

Birincil hedefiniz, yordayıcı değişkeni kullanarak yanıt değişkeninin değerini doğru bir şekilde tahmin etmekse, o zaman R-kare önemlidir.

Genel olarak, R-kare değeri ne kadar büyük olursa, yordayıcı değişkenler yanıt değişkeninin değerini o kadar doğru tahmin edebilir.

R-kare değeri için gereken değer, ihtiyacınız olan hassasiyete bağlıdır. Örneğin bilimsel çalışmalarda bir regresyon modelinin güvenilir sayılması için R-karenin 0,95’ten büyük olması gerekebilir. Diğer alanlarda, veri setinde aşırı değişkenlik varsa yalnızca 0,3’lük bir R kare yeterli olabilir.

Neyin “iyi” bir R-kare değeri olarak kabul edildiğini bilmek için, kendi çalışma alanınızda hangi R-kare değerlerinin genel olarak kabul edildiğini keşfetmeniz gerekecektir. Bir müşteri veya şirket için regresyon analizi yapıyorsanız, onlara kabul edilebilir bir R-kare değerinin ne olduğunu sorabilirsiniz.

Tahmin aralıkları

Tahmin aralığı, tahmin değişkenlerinin değerlerine bağlı olarak yeni bir gözlemin düşebileceği aralığı belirtir. Daha dar tahmin aralıkları, yordayıcı değişkenlerin yanıt değişkenini daha doğru tahmin edebildiğini gösterir.

Çoğu zaman bir tahmin aralığı R-kare değerinden daha yararlı olabilir çünkü size yeni bir gözlemin düşebileceği tam bir değer aralığı verir. Bu, özellikle regresyonun birincil amacının yanıt değişkeninin yeni değerlerini tahmin etmek olması durumunda kullanışlıdır.

Örneğin, 40.000 kişilik bir nüfusun belirli bir şehirde 30 ila 35 çiçekçi tahmin aralığı ürettiğini varsayalım. Bu, regresyon modelinin kullanımına bağlı olarak kabul edilebilir bir değer aralığı olarak kabul edilebilir veya edilmeyebilir.

Çözüm

Genel olarak, R-kare değeri ne kadar büyük olursa, yordayıcı değişkenler yanıt değişkeninin değerini o kadar doğru tahmin edebilir.

Bir R-kare değerinin “iyi” olarak değerlendirilmesi için ne kadar iyi olması gerektiği, alana göre değişir. Bazı alanlar diğerlerinden daha yüksek hassasiyet gerektirir.

Neyin “iyi” bir R-kare değeri olarak kabul edildiğini bulmak için, çalıştığınız alanda genel olarak neyin kabul edildiğini düşünün, belirli bir alanda özel bilgiye sahip birine sorun veya müşteriye/danışana sorun. Regresyon analizini yaptığınız şirket. kabul edilebilir buldukları şeyler için.

Tahminci ile yanıt değişkeni arasındaki ilişkiyi açıklamak istiyorsanız, R-kare büyük ölçüde konu dışıdır çünkü regresyon modelinin yorumlanması üzerinde hiçbir etkisi yoktur.

Yanıt değişkenini tahmin etmek istiyorsanız tahmin aralıkları genellikle R-kare değerlerinden daha kullanışlıdır.

Daha fazla okuma:

Pearson Korelasyon Katsayısı
Basit Doğrusal Regresyona Giriş

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir