Gruplandırılmış veriler

Bu makalede, gruplandırılmış verilerin ne olduğu ve verilerin nasıl gruplandırıldığı açıklanmaktadır. Ek olarak, verilerin aralıklara göre gruplandırıldığı çözülmüş bir alıştırma bulacaksınız.

Gruplandırılmış veriler nedir?

İstatistiklerde, binned veriler aralıklarla gruplandırılmış verilerdir. Başka bir deyişle gruplandırılmış veriler, birlikte çalışılabilecek şekilde düzenli aralıklarla toplanan verilerdir.

Yani bir istatistiksel veri kümesi gruplandırılırken farklı aralıklara ayrılır, böylece her veri parçası yalnızca bir aralığa ait olabilir.

Kısaca istatistikte veri kümeleme, birden fazla verinin birlikte analiz edilmesine olanak tanır, böylece belirli bir aralıkta gruplanan veriler tek bir veri parçası gibi ele alınır. Ayrıca, örnek çok büyük olduğunda veri havuzu oluşturma çok kullanışlıdır.

Gruplandırılmış verilere örnek

Gruplandırılmış verilerin tanımına bakıldığında, aşağıda bir veri kümesinin farklı aralıklarla nasıl gruplandırıldığına dair somut bir örnek verilmiştir.

  • 50 farklı kişiden oluşan örneklem büyüklüğü ölçüldü ve tüm değerler aşağıdaki veri tablosuna kaydedildi. Veri kümesini aralıklar halinde gruplandırın, ardından verilerin grafiğini çizin.

Öncelikle verileri aralıklara ayırmamız gerekiyor. Bunun için birçok yöntem vardır, ancak ideal aralık sayısını hesaplamanıza izin verdiği için en çok kullanılan Sturges kuralıdır:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(50)\\[2ex]c=1+5,64\\[2ex]c=6,64\\[2ex]c\approx 7\end{array}

Bu yüzden verileri yedi farklı aralığa ayırmamız gerekiyor. Artık her aralığın sahip olması gereken genişliği bilmemiz gerekiyor. Bunu yapmak için, maksimum değeri eksi minimum değeri toplam aralık sayısına bölmeniz yeterlidir:

a=\cfrac{\text{valor m\'aximo}-\text{valor m\'inimo}}{c}=\cfrac{205-145}{7}=8,57\approx 9

Kısacası genliği 9 olan 7 aralık olması gerekir, dolayısıyla Sturges kuralına göre hesaplanan aralıklar aşağıdaki gibidir:

[145,154)

[154,163)

[163,172)

[172,181)

[181,190)

[190,199)

[199,208)

Aralıkları hesapladıktan sonra, bir veri parçasının her aralıkta kaç kez göründüğünü sayarız ve gruplandırılmış verilerle bir tablo oluştururuz:

Gruplandırılmış verilerden (göreceli frekans, kümülatif frekans vb.) daha fazla frekans türünün hesaplanabileceğini unutmayın. Gruplandırılmış verilerle eksiksiz bir sıklık tablosunun nasıl oluşturulacağını görmek için burayı tıklayın:

Son olarak, her aralığın sıklığını gösteren tablodan, bir histogram halinde gruplandırılmış verilerin grafiğini çizebiliriz.

Sturges kural histogramı, istatistikler

Gruplandırılmış ve gruplanmamış veriler

Gruplandırılmamış veriler, aralıklara ayrılmamış ancak her değer ayrı ayrı incelenen verilerdir.

Yukarıda çözümlenen örneği takip edersek, verileri gruplamamış olsaydık her değerin sıklığını bulmamız gerekecekti. Yani 158, 165, 174 vb. değerinin kaç katı olduğunu hesaplamamız gerekirdi. Tekrarlanır. Ancak bu durumda verileri aralıklara göre gruplamak daha iyi oldu çünkü elimizde çok fazla veri vardı ve üstelik birçok değer de benzerdi.

Bu nedenle istatistiksel bir çalışma sırasında, hesaplamalar yapılmadan önce verilerin aralıklara göre gruplanıp gruplandırılmayacağına karar verilmesi, araştırmanın geri kalanını belirleyeceği için önemlidir.

Veriler ne zaman konsolide edilmelidir?

Genel olarak değişken sürekli olduğunda veriler aralıklar halinde gruplandırılmalıdır. Değişken sürekli ise normalde birçok değere sahibiz ve bunlar birbirine çok yakın olduğundan çalışmayı basitleştirmek için aralıklar halinde gruplandırılabilirler.

Mantıksal olarak değişken sürekli olmasa bile, elimizde çok fazla veri varsa aralıklar halinde gruplandırılabilir, bu da istatistiksel analizi kolaylaştırır. Ancak genel olarak verileri gruplandırmanın kriteri değişkenin türüdür: Değişken sürekli ise veriler genellikle aralıklara ayrılır.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir