Ggplot2'de bir histogram için kutu sayısı nasıl ayarlanır?
ggplot2’deki bir histogramda kullanılacak kutu sayısını belirtmek için bins bağımsız değişkenini kullanabilirsiniz:
library (ggplot2) ggplot(df, aes (x=x)) + geom_histogram(bins= 10 )
Aşağıdaki örnekler bu argümanın pratikte nasıl kullanılacağını göstermektedir.
Örnek: ggplot2’de histogram için kutu sayısını ayarlayın
Aşağıdaki kod, R’de ortalama değeri 2 olan bir Poisson dağılımını takip eden 10.000 rastgele değer içeren bir veri kümesinin nasıl oluşturulacağını gösterir:
#make this example reproducible
set. seeds (0)
#create data frame with 10,000 random values that follow Poisson distribution
df <- data. frame (values=rpois(n= 10000 , lambda= 2 ))
#view first five rows of data frame
head(df)
values
1 4
2 1
3 1
4 2
5 4
6 1
Veri çerçevesindeki değerlerin dağılımını görselleştirmek amacıyla ggplot2’de bir histogram oluşturmak için aşağıdaki kodu kullanabiliriz:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ')
Varsayılan olarak, ggplot2 histogramda kullanılacak belirli sayıda kutuyu otomatik olarak seçecektir.
Ancak histogramın 10 kutu kullanmasını istediğimizi belirtmek için aşağıdaki sözdizimini kullanabiliriz:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 10 )
Histogramın artık tam olarak 10 kutuya sahip olduğunu unutmayın.
Veya histogramın 5 bölme kullanmasını istediğimizi belirtmek için aşağıdaki sözdizimini kullanabiliriz:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 5 )
Histogramın artık tam olarak 5 kutuya sahip olduğunu unutmayın.
Ne kadar az kutu kullanırsanız her kutunun o kadar geniş olacağını göreceksiniz.
Genel olarak çok az grup kullanırsanız değerlerin temeldeki gerçek dağılımı gizlenecektir.
Ancak çok fazla grup kullanırsanız verilerde gürültü görme riskiyle karşı karşıya kalırsınız.
Histogramda kullanılacak en uygun kutu sayısını bulmanın bir yolu Sturges kuralını kullanmaktır. Bu kural hakkında daha fazla bilgiyi burada bulabilirsiniz.
Not : Geom_histogram işlevine ilişkin tüm belgeleri burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak grafiklerin nasıl oluşturulacağı açıklanmaktadır:
R’de göreceli frekans histogramı nasıl oluşturulur
R’de tek bir grafikte birden fazla kutu grafiği nasıl çizilir
R’de bir grafikte birden fazla çizgi nasıl çizilir