Hoe u een distributieplot maakt in matplotlib
Er zijn twee veelgebruikte manieren om een distributiediagram in Python te maken:
Methode 1: Maak een histogram met Matplotlib
import matplotlib. pyplot as plt
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
Merk op dat kleur de vulkleur van de staven bepaalt, ec de kleur van de staafranden bepaalt, en bins het aantal bins in het histogram bepaalt.
Methode 2: Maak een histogram met dichtheidscurve met behulp van Seaborn
import seaborn as sns
sns. displot (data, kde= True , bins= 15 )
Merk op dat kde=True specificeert dat een dichtheidscurve over het histogram heen moet worden gelegd.
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken om de verdeling van waarden in de volgende NumPy-array te visualiseren:
import numpy as np
#make this example reproducible.
n.p. random . seed ( 1 )
#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )
#view first five values
data[: 5 ]
array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])
Voorbeeld 1: maak een histogram met Matplotlib
We kunnen de volgende code gebruiken om een histogram in Matplotlib te maken om de verdeling van waarden in de NumPy-array te visualiseren:
import matplotlib. pyplot as plt
#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
Op de x-as worden de waarden uit de NumPy-array weergegeven en op de y-as de frequentie van deze waarden.
Houd er rekening mee dat hoe groter de waarde die u gebruikt voor het bins- argument, hoe meer balken er in het histogram zullen zijn.
Voorbeeld 2: Maak een histogram met een dichtheidscurve met behulp van Seaborn
We kunnen de volgende code gebruiken om een histogram te maken met een dichtheidscurve als overlay met behulp van de Seaborn-gegevensvisualisatiebibliotheek:
import seaborn as sns
#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 )
Het resultaat is een histogram waarop een dichtheidscurve is gesuperponeerd.
Het voordeel van het gebruik van een dichtheidscurve is dat deze de vorm van de verdeling samenvat met behulp van één enkele continue curve.
Opmerking : u kunt de volledige documentatie voor de functie seaborn displot() hier vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere algemene diagrammen in Python kunt maken:
Hoe gestapelde staafdiagrammen te maken in Matplotlib
Hoe u een relatief frequentiehistogram maakt in Matplotlib
Hoe maak je een horizontaal staafdiagram in Seaborn?