Como definir o número de compartimentos para um histograma no ggplot2


Você pode usar o argumento bins para especificar o número de compartimentos a serem usados em um histograma em ggplot2 :

 library (ggplot2)

ggplot(df, aes (x=x)) +
  geom_histogram(bins= 10 )

Os exemplos a seguir mostram como usar esse argumento na prática.

Exemplo: definir o número de caixas para histograma em ggplot2

O código a seguir mostra como criar um conjunto de dados em R contendo 10.000 valores aleatórios que segue uma distribuição de Poisson com valor médio de 2:

 #make this example reproducible
set. seeds (0)

#create data frame with 10,000 random values that follow Poisson distribution
df <- data. frame (values=rpois(n= 10000 , lambda= 2 ))

#view first five rows of data frame
head(df)

  values
1 4
2 1
3 1
4 2
5 4
6 1

Podemos usar o seguinte código para criar um histograma no ggplot2 para visualizar a distribuição dos valores no quadro de dados:

 library (ggplot2)

ggplot(df, aes (x=values)) +
  geom_histogram(fill=' steelblue ', col=' black ') 

Por padrão, o ggplot2 selecionará automaticamente um certo número de caixas para usar no histograma.

No entanto, podemos usar a seguinte sintaxe para especificar que queremos que o histograma use 10 compartimentos:

 library (ggplot2)

ggplot(df, aes (x=values)) +
  geom_histogram(fill=' steelblue ', col=' black ', bins= 10 ) 

Observe que o histograma agora possui exatamente 10 caixas.

Ou poderíamos usar a seguinte sintaxe para especificar que queremos que o histograma use 5 compartimentos:

 library (ggplot2)

ggplot(df, aes (x=values)) +
  geom_histogram(fill=' steelblue ', col=' black ', bins= 5 ) 

Observe que o histograma agora possui exatamente 5 caixas.

Você descobrirá que quanto menos caixas usar, mais larga será cada caixa.

Em geral, se você usar poucos grupos, a verdadeira distribuição subjacente de valores ficará oculta.

No entanto, se você usar muitos grupos, corre o risco de simplesmente ver ruído nos dados.

Uma maneira de encontrar o número ideal de compartimentos para usar em um histograma é usar a regra de Sturges . Saiba mais sobre esta regra aqui .

Nota : Você pode encontrar a documentação completa da função geom_histogram aqui .

Recursos adicionais

Os tutoriais a seguir explicam como criar outros gráficos comuns em R:

Como criar um histograma de frequência relativa em R
Como plotar vários boxplots em um único gráfico em R
Como traçar múltiplas linhas em um gráfico em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *