Como criar um gráfico de distribuição no matplotlib


Existem duas maneiras comuns de criar um diagrama de distribuição em Python:

Método 1: criar um histograma usando Matplotlib

 import matplotlib. pyplot as plt

plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

Observe que color controla a cor de preenchimento das barras, ec controla a cor das bordas das barras e bins controla o número de caixas no histograma.

Método 2: Criar um histograma com curva de densidade usando Seaborn

 import seaborn as sns
sns. displot (data, kde= True , bins= 15 )

Observe que kde=True especifica que uma curva de densidade deve ser sobreposta ao histograma.

Os exemplos a seguir mostram como usar cada método na prática para visualizar a distribuição de valores no seguinte array NumPy:

 import numpy as np

#make this example reproducible.
n.p. random . seed ( 1 )

#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )

#view first five values
data[: 5 ]

array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])

Exemplo 1: Crie um histograma usando Matplotlib

Podemos usar o seguinte código para criar um histograma no Matplotlib para visualizar a distribuição dos valores no array NumPy:

 import matplotlib. pyplot as plt

#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

O eixo x exibe os valores da matriz NumPy e o eixo y exibe a frequência desses valores.

Observe que quanto maior o valor usado para o argumento bins , mais barras haverá no histograma.

Exemplo 2: Crie um histograma com uma curva de densidade usando Seaborn

Podemos usar o código a seguir para criar um histograma com uma curva de densidade sobreposta usando a biblioteca de visualização de dados marítimos:

 import seaborn as sns

#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 ) 

O resultado é um histograma no qual uma curva de densidade é sobreposta.

A vantagem de usar uma curva de densidade é que ela resume a forma da distribuição usando uma única curva contínua.

Nota : Você pode encontrar a documentação completa para a função seaborn displot() aqui .

Recursos adicionais

Os tutoriais a seguir explicam como criar outros gráficos comuns em Python:

Como criar gráficos de barras empilhadas no Matplotlib
Como criar um histograma de frequência relativa no Matplotlib
Como criar um gráfico de barras horizontal no Seaborn

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *