Gráfico de pontos e histograma: qual a diferença?


Dois gráficos comumente usados para visualizar a distribuição de valores em um conjunto de dados são gráficos de pontos e histogramas .

Um gráfico de pontos exibe valores de dados individuais ao longo do eixo x e usa pontos para representar as frequências de cada valor individual.

Um histograma exibe intervalos de dados ao longo do eixo x e usa barras retangulares para representar as frequências dos valores pertencentes a cada intervalo.

O exemplo a seguir mostra como criar um gráfico de pontos e um histograma para o mesmo conjunto de dados.

Exemplo: Criando um gráfico de pontos e um histograma para o mesmo conjunto de dados

Suponha que temos o seguinte conjunto de dados com 18 valores:

Dados: 1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10

Esta é a aparência de um gráfico de pontos para este conjunto de dados:

O eixo x mostra valores de dados individuais e o eixo y mostra a frequência de cada valor.

Por exemplo, podemos ver que o valor “2” aparece três vezes no conjunto de dados porque há três pontos acima dele. Da mesma forma, podemos ver que o valor “3” aparece apenas uma vez porque há apenas um ponto acima dele.

E é assim que seria um histograma para este conjunto de dados:

O arrumado.

Por exemplo, podemos ver que sete valores estão entre 0 e 2, dois valores estão entre 2 e 4 e assim por diante.

Bônus : Para quem está curioso, usamos o seguinte código R para criar o gráfico de pontos e o histograma mostrados acima:

 #define dataset
data <- c(1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10)

#create dot plot
stripchart(data, method = "stack", offset = .5, at = 0, pch = 19, cex=5,
           col = "steelblue", main = "Dot Plot",
           xlab = "Data Values", ylab="Frequency")

#create histogram
hist(data, col='steelblue', main='Histogram', xlab='Data Values')

Gráfico de pontos ou histograma: qual você deve usar?

Conforme mencionado anteriormente, um gráfico de pontos e um histograma podem ser usados para visualizar a distribuição de valores em um conjunto de dados.

Como regra geral, geralmente usamos gráficos de pontos quando nosso conjunto de dados é pequeno , pois nos permite ver exatamente quantas vezes cada valor individual aparece.

Por outro lado, normalmente usamos histogramas quando nosso conjunto de dados é grande porque é tedioso criar um ponto para representar cada valor individual em um grande conjunto de dados.

Tenha em mente que a única desvantagem de usar um histograma é que não podemos dizer exatamente quantas vezes cada valor individual aparece.

Por exemplo, no histograma anterior vimos que sete valores estavam entre 0 e 2, mas não sabemos exatamente quantos valores eram 1 e quantos valores eram 2.

Se quisermos apenas entender a “forma” geral de uma distribuição, geralmente não importa se não conhecemos os valores individuais de um conjunto de dados.

Lembre-se também de que não podemos calcular a mediana ou média exata apenas olhando um histograma, porque não conhecemos os valores individuais.

Recursos adicionais

Os tutoriais a seguir fornecem informações adicionais sobre histogramas:

Como estimar os histogramas médios e medianos
Como descrever a forma dos histogramas
Como criar histogramas em R
Como criar um histograma em Python

Os tutoriais a seguir fornecem informações adicionais sobre gráficos de pontos:

Como encontrar o centro e a distribuição de um gráfico de pontos
Como criar um gráfico de pontos no Planilhas Google
Como criar um gráfico de pontos no Excel
Como criar um gráfico de pontos em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *