Python'da örnek ve popülasyon varyansı nasıl hesaplanır?
Varyans , bir veri kümesindeki değerlerin dağılımını ölçmenin bir yoludur.
Popülasyon varyansını hesaplama formülü şöyledir:
σ 2 = Σ (x ben – μ) 2 / N
Altın:
- Σ : “Toplam” anlamına gelen bir sembol
- μ : Nüfus ortalaması
- x i : Popülasyonun i’inci elemanı
- N : Nüfus büyüklüğü
Örnek varyansını hesaplama formülü şöyledir:
s 2 = Σ (x ben – x ) 2 / (n-1)
Altın:
- x : örnek ortalama
- x i : Örneklemin i’inci elemanı
- n : Örneklem büyüklüğü
Belirli bir tablo için örnek varyansı ve popülasyon varyansını (sırasıyla) hızlı bir şekilde hesaplamak için Python’daki istatistik kütüphanesindeki varyans ve pvaryans fonksiyonlarını kullanabiliriz.
from statistics import variance, pvariance #calculate sample variance variance(s) #calculate population variance pvariance(x)
Aşağıdaki örnekler her bir fonksiyonun pratikte nasıl kullanılacağını göstermektedir.
Örnek 1: Python’da Örnek Varyansın Hesaplanması
Aşağıdaki kod Python’da bir tablonun örnek varyansının nasıl hesaplanacağını gösterir:
from statistics import variance #define data data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14] #calculate sample variance variance(data) 22,067
Örnek varyansı 22.067 olarak çıkıyor.
Örnek 2: Python’da Nüfus Varyansını Hesaplamak
Aşağıdaki kod Python’da bir tablonun popülasyon varyansının nasıl hesaplanacağını gösterir:
from statistics import pvariance #define data data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14] #calculate sample variance pvariance(data) 20,596
Nüfus varyansı 20.596 olarak ortaya çıkıyor.
Örneklem ve Popülasyon Varyansının Hesaplanmasına İlişkin Notlar
Örneklem ve popülasyon varyansını hesaplarken aşağıdakileri aklınızda bulundurun:
- Üzerinde çalıştığınız veri seti tüm popülasyonu, yani ilgilendiğiniz her değeri temsil ediyorsa popülasyon varyansını hesaplamanız gerekir.
- Üzerinde çalıştığınız veri seti daha büyük bir popülasyondan alınan bir örneği temsil ediyorsa örnek varyansını hesaplamanız gerekir.
- Belirli bir veri tablosunun örnek varyansı her zaman aynı veri tablosunun popülasyon varyansından daha büyük olacaktır çünkü örnek varyansı hesaplanırken daha fazla belirsizlik vardır, dolayısıyla varyansa ilişkin tahminimiz daha büyük olacaktır.
Ek kaynaklar
Aşağıdaki eğitimlerde Python’da diğer yayılma metriklerinin nasıl hesaplanacağı açıklanmaktadır:
Python’da çeyrekler arası aralık nasıl hesaplanır
Python’da Varyasyon Katsayısı Nasıl Hesaplanır?
Python’da bir listenin standart sapması nasıl hesaplanır?