Gráfico de pontos e histograma: qual a diferença?
Dois gráficos comumente usados para visualizar a distribuição de valores em um conjunto de dados são gráficos de pontos e histogramas .
Um gráfico de pontos exibe valores de dados individuais ao longo do eixo x e usa pontos para representar as frequências de cada valor individual.
Um histograma exibe intervalos de dados ao longo do eixo x e usa barras retangulares para representar as frequências dos valores pertencentes a cada intervalo.
O exemplo a seguir mostra como criar um gráfico de pontos e um histograma para o mesmo conjunto de dados.
Exemplo: Criando um gráfico de pontos e um histograma para o mesmo conjunto de dados
Suponha que temos o seguinte conjunto de dados com 18 valores:
Dados: 1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10
Esta é a aparência de um gráfico de pontos para este conjunto de dados:

O eixo x mostra valores de dados individuais e o eixo y mostra a frequência de cada valor.
Por exemplo, podemos ver que o valor “2” aparece três vezes no conjunto de dados porque há três pontos acima dele. Da mesma forma, podemos ver que o valor “3” aparece apenas uma vez porque há apenas um ponto acima dele.
E é assim que seria um histograma para este conjunto de dados:

O arrumado.
Por exemplo, podemos ver que sete valores estão entre 0 e 2, dois valores estão entre 2 e 4 e assim por diante.
Bônus : Para quem está curioso, usamos o seguinte código R para criar o gráfico de pontos e o histograma mostrados acima:
#define dataset data <- c(1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10) #create dot plot stripchart(data, method = "stack", offset = .5, at = 0, pch = 19, cex=5, col = "steelblue", main = "Dot Plot", xlab = "Data Values", ylab="Frequency") #create histogram hist(data, col='steelblue', main='Histogram', xlab='Data Values')
Gráfico de pontos ou histograma: qual você deve usar?
Conforme mencionado anteriormente, um gráfico de pontos e um histograma podem ser usados para visualizar a distribuição de valores em um conjunto de dados.
Como regra geral, geralmente usamos gráficos de pontos quando nosso conjunto de dados é pequeno , pois nos permite ver exatamente quantas vezes cada valor individual aparece.
Por outro lado, normalmente usamos histogramas quando nosso conjunto de dados é grande porque é tedioso criar um ponto para representar cada valor individual em um grande conjunto de dados.
Tenha em mente que a única desvantagem de usar um histograma é que não podemos dizer exatamente quantas vezes cada valor individual aparece.
Por exemplo, no histograma anterior vimos que sete valores estavam entre 0 e 2, mas não sabemos exatamente quantos valores eram 1 e quantos valores eram 2.

Se quisermos apenas entender a “forma” geral de uma distribuição, geralmente não importa se não conhecemos os valores individuais de um conjunto de dados.
Lembre-se também de que não podemos calcular a mediana ou média exata apenas olhando um histograma, porque não conhecemos os valores individuais.
Recursos adicionais
Os tutoriais a seguir fornecem informações adicionais sobre histogramas:
Como estimar os histogramas médios e medianos
Como descrever a forma dos histogramas
Como criar histogramas em R
Como criar um histograma em Python
Os tutoriais a seguir fornecem informações adicionais sobre gráficos de pontos:
Como encontrar o centro e a distribuição de um gráfico de pontos
Como criar um gráfico de pontos no Planilhas Google
Como criar um gráfico de pontos no Excel
Como criar um gráfico de pontos em R