R: como alterar o número de compartimentos no histograma
Ao criar um histograma em R, uma fórmula conhecida como regra de Sturges é usada para determinar o número ideal de grupos a serem usados.
No entanto, você pode usar a seguinte sintaxe para substituir esta fórmula e especificar um número exato de grupos a serem usados no histograma:
hist(data, breaks = seq(min(data), max(data), length. out = 7 ))
Observe que o número de grupos usados no histograma será um a menos que o número especificado no argumento length.out .
Os exemplos a seguir mostram como usar essa sintaxe na prática.
Exemplo 1: Crie um histograma básico
O código a seguir mostra como criar um histograma básico em R sem especificar o número de compartimentos:
#define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)
#create histogram of data
hist(data, col = ' lightblue ')
Usando a regra de Sturges, R decidiu usar 8 grupos no total no histograma.
Exemplo 2: Especifique o número de compartimentos a serem usados no histograma
O código a seguir mostra como criar um histograma para o mesmo vetor de dados e usar exatamente 6 grupos:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 6 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 ))
Precauções para escolher um número específico de caixas
O número de grupos usados em um histograma tem um enorme impacto na forma como interpretamos um conjunto de dados.
Se usarmos poucos grupos, o verdadeiro padrão subjacente nos dados pode ficar oculto:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 3 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 ))
Por outro lado, se usarmos muitos grupos, podemos simplesmente visualizar o ruído em um conjunto de dados:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 15 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 ))
Em geral, a regra padrão de Sturges usada em R tende a produzir histogramas com um número ideal de grupos.
Sinta-se à vontade para usar o código fornecido aqui para criar um histograma com um número exato de caixas, mas tome cuidado para não escolher muitas ou poucas caixas.
Recursos adicionais
Os tutoriais a seguir explicam como executar outras funções comuns com histogramas em R:
Como plotar vários histogramas em R
Como criar um histograma de duas variáveis em R
Como criar um histograma de frequência relativa em R