C: histogramdaki kutu sayısı nasıl değiştirilir?


R’de bir histogram oluşturduğunuzda, kullanılacak en uygun grup sayısını belirlemek için Sturges kuralı olarak bilinen bir formül kullanılır.

Ancak bu formülü geçersiz kılmak ve histogramda kullanılacak grupların tam sayısını belirtmek için aşağıdaki sözdizimini kullanabilirsiniz:

 hist(data, breaks = seq(min(data), max(data), length. out = 7 ))

Histogramda kullanılan grup sayısının, uzunluk.çıkış bağımsız değişkeninde belirtilen sayıdan bir eksik olacağını unutmayın.

Aşağıdaki örnekler bu sözdiziminin pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: Temel Histogram Oluşturma

Aşağıdaki kod, bölme sayısını belirtmeden R’de temel bir histogramın nasıl oluşturulacağını gösterir:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram of data
hist(data, col = ' lightblue ') 

R, Sturges kuralını kullanarak histogramda toplamda 8 grup kullanmaya karar verdi.

Örnek 2: Histogramda kullanılacak bölme sayısını belirtin

Aşağıdaki kod, aynı veri vektörü için histogramın nasıl oluşturulacağını ve tam olarak 6 grubun nasıl kullanılacağını gösterir:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 6 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 )) 

Belirli Sayıda Kutu Seçimine İlişkin Önlemler

Histogramda kullanılan grup sayısının veri setini nasıl yorumladığımız üzerinde büyük etkisi vardır.

Çok az grup kullanırsak verilerdeki gerçek temel kalıp gizlenebilir:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 3 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 )) 

Tersine, eğer çok fazla grup kullanırsak, bir veri kümesindeki gürültüyü basitçe görselleştirebiliriz:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 15 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 )) 

Genel olarak, R’de kullanılan varsayılan Sturges kuralı, optimal sayıda grupla histogramlar üretme eğilimindedir.

Kesin sayıda bölme içeren bir histogram oluşturmak için burada verilen kodu kullanmaktan çekinmeyin, ancak çok fazla veya çok az bölme seçmemeye dikkat edin.

Ek kaynaklar

Aşağıdaki eğitimlerde R’deki histogramlarla diğer ortak işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de birden fazla histogram nasıl çizilir
R’de iki değişkenin histogramı nasıl oluşturulur
R’de göreceli frekans histogramı nasıl oluşturulur

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir