Varyansın nasıl yorumlanacağına dair basit bir açıklama


İstatistikte çoğu zaman değerlerin bir veri kümesinde nasıl “yayıldığını” anlamak isteriz. Bunu ölçmek için sıklıkla aşağıdaki dağılım ölçülerini kullanırız :

  • Aralık: Bir veri kümesindeki en büyük ve en küçük değerler arasındaki fark.
  • Çeyrekler arası aralık: bir veri kümesinin ilk çeyreği ile üçüncü çeyreği arasındaki fark (kartiller, bir veri kümesini dört eşit parçaya bölen değerlerdir).
  • Standart sapma: değerler ile ortalama arasındaki tipik mesafeyi ölçmenin bir yolu.
  • Varyans: standart sapmanın karesi.

Bu dört ölçümden varyansın sezgisel olarak anlaşılması en zor olanı olma eğilimindedir. Bu makale varyansın basit bir açıklamasını sağlamayı amaçlamaktadır.

Standart Sapmayı Anlamak

Varyansı anlamadan önce, genellikle σ ile gösterilen standart sapmayı anlamalıyız.

Standart sapmayı hesaplama formülü şöyledir:

σ = √(Σ (x ben – μ) 2 / N)

burada μ popülasyon ortalamasıdır, xi popülasyonun i’inci elemanıdır, N popülasyon büyüklüğüdür ve Σ sadece “toplam” anlamına gelen süslü bir semboldür.

Pratikte standart sapmayı elle hesaplamaya nadiren ihtiyaç duyacaksınız; bunun yerine istatistik yazılımı veya hesap makinesi kullanabilirsiniz.

Standart sapma en temel düzeyde bize bir veri kümesindeki veri değerlerinin dağılımını anlatır. Bunu göstermek için aşağıdaki üç veri setini karşılık gelen standart sapmalarıyla birlikte göz önünde bulundurun:

[5, 5, 5] standart sapma = 0 (hiç yayılma yok)

[3, 5, 7] standart sapma = 1,63 (bazı sapmalar)

[1, 5, 99] standart sapma = 45,28 (çok sayıda yayılma)

“Standart sapma” terimi, onu oluşturan iki kelimeye bakılarak anlaşılabilir:

  • “sapma” – bu ortalamaya olan mesafeyi ifade eder.
  • “standart” – bu, bir değer ile ortalama arasındaki “standart” veya “tipik” mesafeyi ifade eder.

Standart sapmayı anladıktan sonra varyansı anlamak çok daha kolaydır.

Boşluğu Anlamak

Genellikle σ2 ile gösterilen varyans, basitçe standart sapmanın karesidir. Bir veri kümesinin varyansını bulma formülü şöyledir:

σ 2 = Σ (x ben – μ) 2 / N

burada μ popülasyon ortalamasıdır, xi popülasyonun i’inci elemanıdır, N popülasyon büyüklüğüdür ve Σ sadece “toplam” anlamına gelen süslü bir semboldür.

Yani, eğer bir veri setinin standart sapması 8 ise varyasyon 8 2 = 64 olacaktır.

Veya bir veri setinin standart sapması 10 ise varyasyon 10 2 = 100 olacaktır.

Veya bir veri setinin standart sapması 3,7 ise varyasyon 3,7 2 = 13,69 olacaktır.

Bir veri setinde değerler ne kadar dağınıksa varyans da o kadar yüksek olur. Bunu göstermek için aşağıdaki üç veri setini karşılık gelen varyanslarıyla birlikte göz önünde bulundurun:

[5, 5, 5] varyans = 0 (hiç yayılma yok)

[3, 5, 7] varyans = 2,67 (bazı sapmalar)

[1, 5, 99] varyans = 2.050,67 (çok sayıda yayılma)

Standart sapma yerine varyansı ne zaman kullanırsınız?

Yukarıdaki standart sapma ve varyans açıklamalarını okuduktan sonra, bir veri kümesini tanımlamak için ne zaman standart sapma yerine varyansı kullanacağınızı merak ediyor olabilirsiniz.

Sonuçta standart sapma bize bir değer ile ortalama arasındaki ortalama mesafeyi söylerken, varyans bize bu değerin karesini verir. Standart sapmanın anlaşılması ve yorumlanması çok daha kolay gibi görünüyor.

Gerçekte, bir veri kümesindeki değerlerin dağılımını tanımlamak için neredeyse her zaman standart sapmayı kullanacaksınız.

Ancak varyans, ANOVA veya regresyon gibi bir teknik kullanıldığında ve bir modelin toplam varyansını belirli faktörlere göre açıklamaya çalışırken yararlı olabilir.

Örneğin, test puanlarındaki farklılığın ne kadarının IQ ile, ne kadarının çalışılan saatlerle açıklanabileceğini anlamak isteyebilirsiniz.

Eğer varyasyonun %36’sı IQ’dan ve %64’ü çalışma saatinden kaynaklanıyorsa, bunu anlamak kolaydır. Ancak 6 ve 8’lik standart sapmaları kullanırsak, bu çok daha az sezgisel olur ve problem bağlamında pek bir anlam ifade etmez.

Standart sapma yerine varyans kullanmanın daha iyi olabileceği başka bir durum da teorik istatistiksel çalışma yaptığınız zamandır.

Bu durumda karekök işareti kullanmanız gerekmediği için hesaplama sırasında varyansı kullanmak çok daha kolaydır.

Ek kaynaklar

Aşağıdaki eğitimler varyans hakkında ek bilgi sağlar:

Örneklem varyansı ve popülasyon varyansı: fark nedir?
Excel’de Örnek ve Popülasyon Varyansı Nasıl Hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir