R'de histogram kırılmaları nasıl belirlenir (örneklerle)


Varsayılan olarak R’deki hist() işlevi, histogramda kullanılacak kutu sayısını belirlemek için Sturges kuralını kullanır.

Sturges kuralı, bir histogramda kullanılacak en uygun grup sayısını belirlemek için aşağıdaki formülü kullanır:

En uygun kutular = ⌈log 2 n + 1⌉

Altın:

  • n: veri setindeki toplam gözlem sayısı.
  • ⌈ ⌉: “Tavan” anlamına gelen semboller, yani cevabın en yakın tam sayıya yuvarlanması.

Örneğin, bir veri setinde 31 gözlem varsa Sturge kuralı, histogramda kullanılacak en uygun grup sayısını belirlemek için aşağıdaki formülü kullanacaktır:

En uygun bölmeler = ⌈log 2 (31) + 1⌉ = ⌈4,954 + 1⌉ = ⌈5,954⌉ = 6 .

Sturges kuralına göre bu veri setini görselleştirmek için histogramda 6 kutu kullanmalıyız.

R’de hist() işlevini kullanırsanız, histogramda görüntülenecek kutu sayısını otomatik olarak seçmek için Sturges kuralı kullanılacaktır.

 hist(data)

Kullanılacak farklı sayıda kutuyu belirtmek için break argümanını kullansanız bile, R bunu yalnızca kaç kutu kullanılacağına dair bir “öneri” olarak kullanacaktır.

 hist(data, breaks= 7 )

Ancak R’yi histogramda belirli sayıda kutu kullanmaya zorlamak için aşağıdaki kodu kullanabilirsiniz:

 #create histogram with 7 bins
hist(data, breaks = seq(min(data), max(data), length. out = 8 ))

Not : Long.out için n+1 uzunluğunu kullanmalısınız; burada n , istediğiniz bölme sayısını gösterir.

Aşağıdaki örnekte bu kodun pratikte nasıl kullanılacağı gösterilmektedir.

Örnek: R’de Histogram Sonlarını Belirleme

R’de 16 değere sahip aşağıdaki veri setine sahip olduğumuzu varsayalım:

 #create vector of 16 values
data <- c(2, 3, 3, 3, 4, 4, 5, 6, 8, 10, 12, 14, 15, 18, 20, 21)

Hist() fonksiyonunu kullanırsak, R 5 kutulu aşağıdaki histogramı oluşturacaktır:

 #create histogram
hist(data)

Not : R, 16 gözlem içeren bir veri setini görselleştirmek için kullanılacak en uygun grup sayısının 5 grup olduğunu belirlemek için Sturges kuralını kullandı.

Histogramda kullanılacak 7 grubu belirtmek için break argümanını kullanmaya çalışırsak, R bunu yalnızca bir “öneri” olarak kabul edecek ve bunun yerine 10 grup kullanmayı seçecektir:

 #attempt to create histogram with 7 bins
hist(data, breaks= 7 ) 

Ancak R’yi histogramda 7 kutu kullanmaya zorlamak için aşağıdaki kodu kullanabiliriz:

 #create histogram with 7 bins
hist(data, breaks = seq(min(data), max(data), length. out = 8 ))

Sonucun 7 eşit aralıklı kutudan oluşan bir histogram olduğuna dikkat edin.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de göreceli frekans histogramı nasıl oluşturulur
R’de birden fazla histogram nasıl çizilir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir