Comment créer un diagramme de distribution dans Matplotlib
Il existe deux manières courantes de créer un diagramme de distribution en Python :
Méthode 1 : créer un histogramme à l’aide de Matplotlib
import matplotlib.pyplot as plt
plt.hist(data, color='lightgreen', ec='black', bins=15)
Notez que color contrôle la couleur de remplissage des barres, ec contrôle la couleur des bords des barres et bins contrôle le nombre de cases dans l’histogramme.
Méthode 2 : Créer un histogramme avec une courbe de densité à l’aide de Seaborn
import seaborn as sns
sns.displot(data, kde=True, bins=15)
Notez que kde=True spécifie qu’une courbe de densité doit être superposée sur l’histogramme.
Les exemples suivants montrent comment utiliser chaque méthode dans la pratique pour visualiser la distribution des valeurs dans le tableau NumPy suivant :
import numpy as np
#make this example reproducible.
np.random.seed(1)
#create numpy array with 1000 values that follow normal dist with mean=10 and sd=2
data = np.random.normal(size=1000, loc=10, scale=2)
#view first five values
data[:5]
array([13.24869073, 8.77648717, 8.9436565 , 7.85406276, 11.73081526])
Exemple 1 : créer un histogramme à l’aide de Matplotlib
Nous pouvons utiliser le code suivant pour créer un histogramme dans Matplotlib afin de visualiser la distribution des valeurs dans le tableau NumPy :
import matplotlib.pyplot as plt
#create histogram
plt.hist(data, color='lightgreen', ec='black', bins=15)
L’axe des x affiche les valeurs du tableau NumPy et l’axe des y affiche la fréquence de ces valeurs.
Notez que plus la valeur que vous utilisez pour l’argument bins est grande, plus il y aura de barres dans l’histogramme.
Exemple 2 : Créer un histogramme avec une courbe de densité à l’aide de Seaborn
Nous pouvons utiliser le code suivant pour créer un histogramme avec une courbe de densité superposée à l’aide de la bibliothèque de visualisation de données seaborn :
import seaborn as sns
#create histogram with density curve overlaid
sns.displot(data, kde=True, bins=15)
Le résultat est un histogramme sur lequel est superposée une courbe de densité.
L’avantage de l’utilisation d’une courbe de densité est qu’elle résume la forme de la distribution à l’aide d’une seule courbe continue.
Remarque : Vous pouvez trouver la documentation complète de la fonction seaborn displot() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment créer d’autres graphiques courants en Python :
Comment créer des graphiques à barres empilées dans Matplotlib
Comment créer un histogramme de fréquence relative dans Matplotlib
Comment créer un barplot horizontal dans Seaborn