Python'da örnek ve popülasyon varyansı nasıl hesaplanır?


Varyans , bir veri kümesindeki değerlerin dağılımını ölçmenin bir yoludur.

Popülasyon varyansını hesaplama formülü şöyledir:

σ 2 = Σ (x ben – μ) 2 / N

Altın:

  • Σ : “Toplam” anlamına gelen bir sembol
  • μ : Nüfus ortalaması
  • x i : Popülasyonun i’inci elemanı
  • N : Nüfus büyüklüğü

Örnek varyansını hesaplama formülü şöyledir:

s 2 = Σ (x benx ) 2 / (n-1)

Altın:

  • x : örnek ortalama
  • x i : Örneklemin i’inci elemanı
  • n : Örneklem büyüklüğü

Belirli bir tablo için örnek varyansı ve popülasyon varyansını (sırasıyla) hızlı bir şekilde hesaplamak için Python’daki istatistik kütüphanesindeki varyans ve pvaryans fonksiyonlarını kullanabiliriz.

 from statistics import variance, pvariance

#calculate sample variance
variance(s)

#calculate population variance
pvariance(x)

Aşağıdaki örnekler her bir fonksiyonun pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: Python’da Örnek Varyansın Hesaplanması

Aşağıdaki kod Python’da bir tablonun örnek varyansının nasıl hesaplanacağını gösterir:

 from statistics import variance 

#define data
data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14]

#calculate sample variance
variance(data)

22,067

Örnek varyansı 22.067 olarak çıkıyor.

Örnek 2: Python’da Nüfus Varyansını Hesaplamak

Aşağıdaki kod Python’da bir tablonun popülasyon varyansının nasıl hesaplanacağını gösterir:

 from statistics import pvariance 

#define data
data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14]

#calculate sample variance
pvariance(data)

20,596

Nüfus varyansı 20.596 olarak ortaya çıkıyor.

Örneklem ve Popülasyon Varyansının Hesaplanmasına İlişkin Notlar

Örneklem ve popülasyon varyansını hesaplarken aşağıdakileri aklınızda bulundurun:

  • Üzerinde çalıştığınız veri seti tüm popülasyonu, yani ilgilendiğiniz her değeri temsil ediyorsa popülasyon varyansını hesaplamanız gerekir.
  • Üzerinde çalıştığınız veri seti daha büyük bir popülasyondan alınan bir örneği temsil ediyorsa örnek varyansını hesaplamanız gerekir.
  • Belirli bir veri tablosunun örnek varyansı her zaman aynı veri tablosunun popülasyon varyansından daha büyük olacaktır çünkü örnek varyansı hesaplanırken daha fazla belirsizlik vardır, dolayısıyla varyansa ilişkin tahminimiz daha büyük olacaktır.

Ek kaynaklar

Aşağıdaki eğitimlerde Python’da diğer yayılma metriklerinin nasıl hesaplanacağı açıklanmaktadır:

Python’da çeyrekler arası aralık nasıl hesaplanır
Python’da Varyasyon Katsayısı Nasıl Hesaplanır?
Python’da bir listenin standart sapması nasıl hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir