R: como alterar o número de compartimentos no histograma


Ao criar um histograma em R, uma fórmula conhecida como regra de Sturges é usada para determinar o número ideal de grupos a serem usados.

No entanto, você pode usar a seguinte sintaxe para substituir esta fórmula e especificar um número exato de grupos a serem usados no histograma:

 hist(data, breaks = seq(min(data), max(data), length. out = 7 ))

Observe que o número de grupos usados no histograma será um a menos que o número especificado no argumento length.out .

Os exemplos a seguir mostram como usar essa sintaxe na prática.

Exemplo 1: Crie um histograma básico

O código a seguir mostra como criar um histograma básico em R sem especificar o número de compartimentos:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram of data
hist(data, col = ' lightblue ') 

Usando a regra de Sturges, R decidiu usar 8 grupos no total no histograma.

Exemplo 2: Especifique o número de compartimentos a serem usados no histograma

O código a seguir mostra como criar um histograma para o mesmo vetor de dados e usar exatamente 6 grupos:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 6 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 )) 

Precauções para escolher um número específico de caixas

O número de grupos usados em um histograma tem um enorme impacto na forma como interpretamos um conjunto de dados.

Se usarmos poucos grupos, o verdadeiro padrão subjacente nos dados pode ficar oculto:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 3 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 )) 

Por outro lado, se usarmos muitos grupos, podemos simplesmente visualizar o ruído em um conjunto de dados:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 15 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 )) 

Em geral, a regra padrão de Sturges usada em R tende a produzir histogramas com um número ideal de grupos.

Sinta-se à vontade para usar o código fornecido aqui para criar um histograma com um número exato de caixas, mas tome cuidado para não escolher muitas ou poucas caixas.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras funções comuns com histogramas em R:

Como plotar vários histogramas em R
Como criar um histograma de duas variáveis em R
Como criar um histograma de frequência relativa em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *