Come creare un grafico di distribuzione in matplotlib


Esistono due modi comuni per creare un diagramma di distribuzione in Python:

Metodo 1: creare un istogramma utilizzando Matplotlib

 import matplotlib. pyplot as plt

plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

Tieni presente che color controlla il colore di riempimento delle barre, ec controlla il colore dei bordi delle barre e bin controlla il numero di contenitori nell’istogramma.

Metodo 2: creare un istogramma con curva di densità utilizzando Seaborn

 import seaborn as sns
sns. displot (data, kde= True , bins= 15 )

Nota che kde=True specifica che una curva di densità dovrebbe essere sovrapposta all’istogramma.

I seguenti esempi mostrano come utilizzare nella pratica ciascun metodo per visualizzare la distribuzione dei valori nel seguente array NumPy:

 import numpy as np

#make this example reproducible.
n.p. random . seed ( 1 )

#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )

#view first five values
data[: 5 ]

array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])

Esempio 1: creare un istogramma utilizzando Matplotlib

Possiamo utilizzare il seguente codice per creare un istogramma in Matplotlib per visualizzare la distribuzione dei valori nell’array NumPy:

 import matplotlib. pyplot as plt

#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

L’asse x mostra i valori dell’array NumPy e l’asse y mostra la frequenza di questi valori.

Tieni presente che maggiore è il valore utilizzato per l’argomento bins , maggiore sarà il numero di barre presenti nell’istogramma.

Esempio 2: crea un istogramma con una curva di densità utilizzando Seaborn

Possiamo utilizzare il seguente codice per creare un istogramma con una curva di densità sovrapposta utilizzando la libreria di visualizzazione dei dati Seaborn:

 import seaborn as sns

#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 ) 

Il risultato è un istogramma al quale è sovrapposta una curva di densità.

Il vantaggio di utilizzare una curva di densità è che riassume la forma della distribuzione utilizzando un’unica curva continua.

Nota : puoi trovare la documentazione completa per la funzione seaborn diplot() qui .

Risorse addizionali

I seguenti tutorial spiegano come creare altri grafici comuni in Python:

Come creare grafici a barre in pila in Matplotlib
Come creare un istogramma di frequenza relativo in Matplotlib
Come creare un barplot orizzontale in Seaborn

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *