Jak ustawić liczbę pojemników dla histogramu w ggplot2
Możesz użyć argumentu bins , aby określić liczbę pojemników do użycia w histogramie w ggplot2 :
library (ggplot2) ggplot(df, aes (x=x)) + geom_histogram(bins= 10 )
Poniższe przykłady pokazują, jak zastosować ten argument w praktyce.
Przykład: ustaw liczbę przedziałów dla histogramu w ggplot2
Poniższy kod pokazuje, jak utworzyć zbiór danych w R zawierający 10 000 losowych wartości zgodnych z rozkładem Poissona ze średnią wartością 2:
#make this example reproducible
set. seeds (0)
#create data frame with 10,000 random values that follow Poisson distribution
df <- data. frame (values=rpois(n= 10000 , lambda= 2 ))
#view first five rows of data frame
head(df)
values
1 4
2 1
3 1
4 2
5 4
6 1
Możemy użyć poniższego kodu, aby utworzyć histogram w ggplot2 w celu wizualizacji rozkładu wartości w ramce danych:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ')
Domyślnie ggplot2 automatycznie wybierze określoną liczbę pól do użycia na histogramie.
Możemy jednak użyć następującej składni, aby określić, że histogram ma używać 10 przedziałów:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 10 )
Zauważ, że histogram ma teraz dokładnie 10 pól.
Możemy też użyć następującej składni, aby określić, że histogram ma używać 5 przedziałów:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 5 )
Zauważ, że histogram ma teraz dokładnie 5 pól.
Przekonasz się, że im mniej pojemników użyjesz, tym szerszy będzie każdy pojemnik.
Ogólnie rzecz biorąc, jeśli użyjesz zbyt małej liczby grup, prawdziwy rozkład wartości zostanie ukryty.
Jeśli jednak użyjesz zbyt wielu grup, ryzykujesz po prostu zobaczeniem szumu w danych.
Jednym ze sposobów znalezienia optymalnej liczby pojemników do użycia w histogramie jest skorzystanie z reguły Sturgesa . Więcej informacji na temat tej zasady znajdziesz tutaj .
Uwaga : Pełną dokumentację funkcji geom_histogram można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak tworzyć inne popularne wykresy w R:
Jak utworzyć histogram częstotliwości względnej w R
Jak wykreślić wiele wykresów skrzynkowych na jednym wykresie w R
Jak wykreślić wiele linii na wykresie w R