Varyansla ne açıklanır? (tanım & #038; örnek)
Açıklanan varyans (bazen “açıklanan varyasyon” olarak da adlandırılır), bir modeldeki yanıt değişkeninin, modelin yordayıcı değişken(ler)i tarafından açıklanabilen varyansını ifade eder.
Bir modelin açıklanan varyansı ne kadar yüksek olursa, modelin açıklayabildiği verilerdeki varyasyon da o kadar fazla olur.
Açıklanan varyans iki farklı istatistiksel modelin sonuçlarında görülmektedir:
1. ANOVA: üç veya daha fazla bağımsız grubun ortalamalarını karşılaştırmak için kullanılır.
2. Regresyon: Bir veya daha fazla öngörücü değişken ile bir yanıt değişkeni arasındaki ilişkiyi ölçmek için kullanılır.
Aşağıdaki örnekler, bu yöntemlerin her birindeki artık varyansın nasıl yorumlanacağını göstermektedir.
Not : Açıklanan varyansın tam tersi, artık varyans olarak adlandırılır.
ANOVA modellerinde açıklanan varyans
Bir ANOVA (“varyans analizi”) modelini her yerleştirdiğimizde, aşağıdakine benzeyen bir ANOVA tablosu elde ederiz:
Açıklanan varyans, gruplar arası varyasyon için SS (“kareler toplamı”) sütununda bulunur.
Yukarıdaki ANOVA modelinde açıklanan varyansın 192,2 olduğunu görüyoruz.
Açıklanan bu varyansın “yüksek” olup olmadığını belirlemek için gruplar içi ortalama kareler toplamını ve gruplar arası kareler ortalamasını hesaplayabilir ve ikisi arasındaki oranı bulabiliriz; bu oran ANOVA tablosunda genel F değerini verir.
- F = MS girer / MS girer
- F = 96,1 / 40,76296
- F = 2,357
Yukarıdaki ANOVA tablosunda F değeri 2,357 ve buna karşılık gelen p değeri 0,113848’dir.
Bu p değeri α = 0,05’ten küçük olmadığından ANOVA’nın sıfır hipotezini reddetmek için yeterli kanıtımız yok.
Bu, karşılaştırdığımız gruplar arasındaki ortalama farkın önemli ölçüde farklı olduğunu söylemek için yeterli kanıta sahip olmadığımız anlamına geliyor.
Bu bize ANOVA modelinde açıklanan varyansın açıklanamayan varyansa göre küçük olduğunu gösterir.
Regresyon modellerinde açıklanan varyans
Bir regresyon modelinde, açıklanan varyans R-kare olarak özetlenir ve genellikle R2 olarak yazılır.
Bu değer, modeldeki yordayıcı değişken(ler) tarafından açıklanabilen yanıt değişkenindeki varyansın oranını temsil eder.
R karenin değeri 0’dan şuraya kadar değişebilir:
- 0 değeri, yanıt değişkeninin yordayıcı değişken(ler) tarafından hiçbir şekilde açıklanamayacağını gösterir.
- 1 değeri, yanıt değişkeninin yordayıcı değişken(ler) tarafından hatasız olarak mükemmel bir şekilde açıklanabileceğini gösterir.
Bir regresyon modelini uydurduğumuzda genellikle aşağıdakine benzer bir sonuç elde ederiz:
Açıklanan varyansın 168,5976 , toplam varyansın ise 174,5 olduğunu görüyoruz.
Bu değerleri kullanarak bu regresyon modelinin R-kare değerini şu şekilde hesaplayabiliriz:
- R kare: Regresyon SS / Toplam SS
- R kare: 168,5976 / 174,5
- R kare: 0,966
Bu modelin R-kare değerinin 1’e yakın olması modelde açıklanan varyansın oldukça yüksek olduğunu göstermektedir.
Başka bir deyişle, model, yanıt değişkenindeki değişimi açıklamak için yordayıcı değişkenleri kullanma konusunda iyi bir iş çıkarabilir.
İlgili: İyi bir R-kare değeri nedir?