Herhangi bir histogramın standart sapması nasıl tahmin edilir?
Histogram, bir veri kümesindeki değerlerin dağılımını görselleştirmenin kullanışlı bir yolunu sağlar.
Histogramın x ekseni veri değeri gruplarını görüntüler ve y ekseni bize her grupta bir veri setindeki kaç gözlemin olduğunu söyler.
Histogram, gözlemleri bölmelere yerleştirdiğinden, histogram tarafından temsil edilen veri kümesinin tam standart sapmasını hesaplamak mümkün değildir, ancak standart sapmayı tahmin etmek mümkündür.
Aşağıdaki örnek bunun nasıl yapılacağını gösterir.
İlgili: Herhangi Bir Histogramın Ortalaması ve Medyanı Nasıl Tahmin Edilir?
Bir histogramın standart sapması nasıl tahmin edilir
Bir histogramın standart sapmasını tahmin etmek için öncelikle ortalamayı tahmin etmeniz gerekir.
Ortalamayı tahmin etmek için aşağıdaki formülü kullanabiliriz:
Ortalama: Σm i n i / N
Altın:
- m i : i’inci bölmenin ortası
- n i : i . kutunun frekansı
- N: Toplam örneklem büyüklüğü
Örneğin aşağıdaki histograma sahip olduğumuzu varsayalım:
Bu histogramın ortalama değerini şu şekilde tahmin edebilirsiniz:
Ortalamanın 22,89 olduğunu tahmin ediyoruz.
Not: Her grubun orta noktası, aralığın alt ve üst değerlerinin ortalaması alınarak bulunabilir. Örneğin birinci grubun orta noktası şu şekilde hesaplanır: (1+10) / 2 = 5,5.
Artık ortalamaya ilişkin bir tahminimiz olduğuna göre, standart sapmayı tahmin etmek için aşağıdaki formülü kullanabiliriz:
Standart sapma: √ Σn ben (m ben -μ) 2 / (N-1)
Altın:
- n i : i . kutunun frekansı
- m i : i’inci bölmenin ortası
- μ : Ortalama
- N: Toplam örneklem büyüklüğü
Bu formülü veri kümemize şu şekilde uygulayacağız:
Veri setinin standart sapmasını 9,6377 olarak tahmin ediyoruz.
Veri setinin standart sapmasına tam olarak uyması garanti edilmese de (veri setinin ham veri değerlerini bilmediğimiz için), standart sapmaya ilişkin en iyi tahminimizi temsil eder.
Ek kaynaklar
Aşağıdaki eğitimlerde gruplar halinde gruplandırılmış verilerle ilgili diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Gruplandırılmış verilerin varyansı nasıl bulunur?
Gruplandırılmış verilerin medyanı nasıl bulunur?
Gruplandırılmış veri modunu bulma