Como criar um gráfico de distribuição no matplotlib
Existem duas maneiras comuns de criar um diagrama de distribuição em Python:
Método 1: criar um histograma usando Matplotlib
import matplotlib. pyplot as plt
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
Observe que color controla a cor de preenchimento das barras, ec controla a cor das bordas das barras e bins controla o número de caixas no histograma.
Método 2: Criar um histograma com curva de densidade usando Seaborn
import seaborn as sns
sns. displot (data, kde= True , bins= 15 )
Observe que kde=True especifica que uma curva de densidade deve ser sobreposta ao histograma.
Os exemplos a seguir mostram como usar cada método na prática para visualizar a distribuição de valores no seguinte array NumPy:
import numpy as np
#make this example reproducible.
n.p. random . seed ( 1 )
#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )
#view first five values
data[: 5 ]
array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])
Exemplo 1: Crie um histograma usando Matplotlib
Podemos usar o seguinte código para criar um histograma no Matplotlib para visualizar a distribuição dos valores no array NumPy:
import matplotlib. pyplot as plt
#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
O eixo x exibe os valores da matriz NumPy e o eixo y exibe a frequência desses valores.
Observe que quanto maior o valor usado para o argumento bins , mais barras haverá no histograma.
Exemplo 2: Crie um histograma com uma curva de densidade usando Seaborn
Podemos usar o código a seguir para criar um histograma com uma curva de densidade sobreposta usando a biblioteca de visualização de dados marítimos:
import seaborn as sns
#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 )
O resultado é um histograma no qual uma curva de densidade é sobreposta.
A vantagem de usar uma curva de densidade é que ela resume a forma da distribuição usando uma única curva contínua.
Nota : Você pode encontrar a documentação completa para a função seaborn displot() aqui .
Recursos adicionais
Os tutoriais a seguir explicam como criar outros gráficos comuns em Python:
Como criar gráficos de barras empilhadas no Matplotlib
Como criar um histograma de frequência relativa no Matplotlib
Como criar um gráfico de barras horizontal no Seaborn