So erstellen sie ein verteilungsdiagramm in matplotlib


Es gibt zwei gängige Methoden zum Erstellen eines Verteilungsdiagramms in Python:

Methode 1: Erstellen Sie ein Histogramm mit Matplotlib

 import matplotlib. pyplot as plt

plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

Beachten Sie, dass „color“ die Füllfarbe der Balken steuert, „ ec “ die Farbe der Balkenkanten und „ bins “ die Anzahl der Bins im Histogramm steuert.

Methode 2: Erstellen Sie mit Seaborn ein Histogramm mit Dichtekurve

 import seaborn as sns
sns. displot (data, kde= True , bins= 15 )

Beachten Sie, dass kde=True angibt, dass dem Histogramm eine Dichtekurve überlagert werden soll.

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis verwendet wird, um die Werteverteilung im folgenden NumPy-Array zu visualisieren:

 import numpy as np

#make this example reproducible.
n.p. random . seed ( 1 )

#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )

#view first five values
data[: 5 ]

array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])

Beispiel 1: Erstellen Sie ein Histogramm mit Matplotlib

Mit dem folgenden Code können wir in Matplotlib ein Histogramm erstellen, um die Verteilung der Werte im NumPy-Array zu visualisieren:

 import matplotlib. pyplot as plt

#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

Die x-Achse zeigt die Werte aus dem NumPy-Array und die y-Achse zeigt die Häufigkeit dieser Werte an.

Beachten Sie, dass das Histogramm umso mehr Balken enthält, je größer der Wert ist, den Sie für das Argument „bins“ verwenden.

Beispiel 2: Erstellen Sie mit Seaborn ein Histogramm mit einer Dichtekurve

Wir können den folgenden Code verwenden, um mithilfe der Seaborn-Datenvisualisierungsbibliothek ein Histogramm mit einer überlagerten Dichtekurve zu erstellen:

 import seaborn as sns

#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 ) 

Das Ergebnis ist ein Histogramm, dem eine Dichtekurve überlagert ist.

Der Vorteil der Verwendung einer Dichtekurve besteht darin, dass sie die Form der Verteilung in einer einzigen kontinuierlichen Kurve zusammenfasst.

Hinweis : Die vollständige Dokumentation für die Seaborn-Funktion displot() finden Sie hier .

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere gängige Diagramme in Python erstellen:

So erstellen Sie gestapelte Balkendiagramme in Matplotlib
So erstellen Sie ein relatives Häufigkeitshistogramm in Matplotlib
So erstellen Sie ein horizontales Balkendiagramm in Seaborn

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert