Como definir o número de compartimentos para um histograma no ggplot2
Você pode usar o argumento bins para especificar o número de compartimentos a serem usados em um histograma em ggplot2 :
library (ggplot2) ggplot(df, aes (x=x)) + geom_histogram(bins= 10 )
Os exemplos a seguir mostram como usar esse argumento na prática.
Exemplo: definir o número de caixas para histograma em ggplot2
O código a seguir mostra como criar um conjunto de dados em R contendo 10.000 valores aleatórios que segue uma distribuição de Poisson com valor médio de 2:
#make this example reproducible
set. seeds (0)
#create data frame with 10,000 random values that follow Poisson distribution
df <- data. frame (values=rpois(n= 10000 , lambda= 2 ))
#view first five rows of data frame
head(df)
values
1 4
2 1
3 1
4 2
5 4
6 1
Podemos usar o seguinte código para criar um histograma no ggplot2 para visualizar a distribuição dos valores no quadro de dados:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ')
Por padrão, o ggplot2 selecionará automaticamente um certo número de caixas para usar no histograma.
No entanto, podemos usar a seguinte sintaxe para especificar que queremos que o histograma use 10 compartimentos:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 10 )
Observe que o histograma agora possui exatamente 10 caixas.
Ou poderíamos usar a seguinte sintaxe para especificar que queremos que o histograma use 5 compartimentos:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 5 )
Observe que o histograma agora possui exatamente 5 caixas.
Você descobrirá que quanto menos caixas usar, mais larga será cada caixa.
Em geral, se você usar poucos grupos, a verdadeira distribuição subjacente de valores ficará oculta.
No entanto, se você usar muitos grupos, corre o risco de simplesmente ver ruído nos dados.
Uma maneira de encontrar o número ideal de compartimentos para usar em um histograma é usar a regra de Sturges . Saiba mais sobre esta regra aqui .
Nota : Você pode encontrar a documentação completa da função geom_histogram aqui .
Recursos adicionais
Os tutoriais a seguir explicam como criar outros gráficos comuns em R:
Como criar um histograma de frequência relativa em R
Como plotar vários boxplots em um único gráfico em R
Como traçar múltiplas linhas em um gráfico em R