Sınıf sayısı (istatistikler)

Bu makalede istatistikte sınıf sayısının nasıl bulunacağı açıklanmaktadır. Sınıf sayısını bulduktan sonra aralıkların genişliğinin nasıl hesaplandığını da öğrenecek ve ayrıca birçok somut örnek görebileceksiniz.

İstatistikte ders sayısı nasıl hesaplanır

Temel olarak istatistikte, bir veri örneği için ideal sınıf sayısını hesaplamak için iki yöntem vardır: Bir formül olan Sturges kuralı ve toplam veri sayısının karekökünü bulmayı içeren kök yöntemi.

Örneğe bağlı olarak, bir yöntemin veya diğerinin kullanılması tavsiye edilir. Her iki yöntem de aşağıda bir örnekle açıklanmaktadır.

Sturges’in kuralı

Sturges kuralı, bir veri setinin bölünmesi gereken ideal sınıf veya aralık sayısını hesaplamak için kullanılan bir kuraldır. Spesifik olarak Sturges Kuralı formülü, uygun sınıf sayısının bir artı toplam veri noktası sayısının iki tabanı logaritmasına eşit olduğunu belirtir.

c=1+\log_2(N)

Altın

c

sınıfların veya aralıkların sayısıdır ve

N

örnekteki toplam gözlem sayısıdır.

Çoğu hesap makinesi yalnızca 10 tabanlı logaritmalarla hesaplamalara izin verir. Bu durumda eşdeğer formülü kullanabilirsiniz:

c=1+\cfrac{\log(N)}{\log(2)}

Örneğin 100 gözlemden oluşan istatistiksel bir örneklemimiz varsa Sturges kuralına göre verilerin gruplandırılması gereken sınıf sayısı şu şekilde hesaplanır:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

Yani toplam 100 veri noktasına sahip bir örnek için verilerin 8 farklı aralığa bölünmesi gerekir.

kök yöntemi

Sturges kuralı elbette daha iyi bilinmesine rağmen, sınıf sayısını hesaplamak için istatistikte yaygın olarak kullanılan bir başka yöntem de örneklem büyüklüğünün karekökünü hesaplamaktır.

İdeal sınıf sayısını hesaplamak için başka bir formül şu şekildedir:

c=\sqrt{N}

Altın

c

sınıfların veya aralıkların sayısıdır ve

N

örnekteki veri öğelerinin toplam sayısıdır.

Örneğin toplamda 150 adet verimiz varsa, verileri bölmemiz gereken aralık sayısının hesaplanması şu şekilde olacaktır:

c=\sqrt{150}=12,25 \approx 12

Örneklem büyüklüğü 200’den az olduğunda önceki formül kullanılır, ancak 200 veya daha fazla veriye sahip olduğumuzda sınıf sayısını küp kökünü alarak hesaplamak daha iyidir:

c=\sqrt[3]{N}

Altın

c

sınıfların veya aralıkların sayısıdır ve

N

örnekteki veri öğelerinin toplam sayısıdır.

Sınıf sayısı ve aralık genişliği

Kutu sayısını hesapladıktan sonra her aralığın ne kadar geniş olması gerektiğini aşağıdaki formülü kullanarak hesaplayabiliriz:

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

Örnek olarak aşağıda bir alıştırma çözülmüştür, böylece aralıkların genişliğinin nasıl hesaplandığını görebilirsiniz.

  • Aşağıdaki istatistiksel veriler kaydedildi. Sturges kuralıyla sınıf sayısını hesaplayın ve ardından her aralığın genişliğini belirleyin.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

Yukarıda gördüğümüz gibi verilerin gruplandırılması gereken sınıf sayısını belirlemek için Sturges kuralını uyguluyoruz. Bu durumda 39 verimiz var, dolayısıyla formülde N parametresini 39 ile değiştirmeliyiz:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

Artık uygun sınıf sayısını bildiğimize göre, her sınıfın genişliğini hesaplayalım. Bunu yapmak için öncelikle örnek verilerin aralığını hesaplamamız gerekir:

R=98-2=96

Örneklem boyutunu öğrendikten sonra, bulunan değeri önceden hesaplanan sınıf sayısına (6) böleriz:

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

Bu nedenle tüm sınıfların genişliği 16 birim olmalıdır. Bu nedenle elde edebileceğimiz sınıflar şunlardır:

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

Frekans dağılımındaki sınıf sayısı

Son olarak, bir frekans dağılımı (veya frekans tablosu) yaparken sınıf sayısını hesaplamanın önemli olduğunu belirtmek gerekir; bu şekilde verileri hızlı bir şekilde farklı aralıklara ayırabilir ve ardından her aralığın tüm frekans türlerini bulabilirsiniz. .

Ne olduğunu bilmiyorsanız frekans dağılımı, her aralık için tüm frekans türlerini listeleyen bir tablodur. Yani her satır farklı bir sınıftır ve her sütun farklı bir frekans tipine sahiptir.

Gruplandırılmış verilere sahip bir frekans dağılımı örneğini görmek için aşağıdaki bağlantıya tıklayın:

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir