Jak utworzyć wykres dystrybucji w matplotlib
Istnieją dwa popularne sposoby tworzenia diagramu dystrybucji w Pythonie:
Metoda 1: Utwórz histogram za pomocą Matplotlib
import matplotlib. pyplot as plt
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
Należy pamiętać, że kolor steruje kolorem wypełnienia słupków, ec steruje kolorem krawędzi słupków, a pojemniki steruje liczbą pojemników na histogramie.
Metoda 2: Utwórz histogram z krzywą gęstości za pomocą programu Seaborn
import seaborn as sns
sns. displot (data, kde= True , bins= 15 )
Zauważ, że kde=True określa, że na histogram powinna zostać nałożona krzywa gęstości.
Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą metodę do wizualizacji rozkładu wartości w poniższej tablicy NumPy:
import numpy as np
#make this example reproducible.
n.p. random . seed ( 1 )
#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )
#view first five values
data[: 5 ]
array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])
Przykład 1: Utwórz histogram za pomocą Matplotlib
Możemy użyć poniższego kodu, aby utworzyć histogram w Matplotlib, aby zwizualizować rozkład wartości w tablicy NumPy:
import matplotlib. pyplot as plt
#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
Oś x wyświetla wartości z tablicy NumPy, a oś y wyświetla częstotliwość tych wartości.
Należy pamiętać, że im większą wartość zastosujesz w argumencie bins , tym więcej słupków będzie na histogramie.
Przykład 2: Utwórz histogram z krzywą gęstości za pomocą Seaborn
Możemy użyć poniższego kodu, aby utworzyć histogram z nałożoną krzywą gęstości , korzystając z biblioteki wizualizacji danych seaborn:
import seaborn as sns
#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 )
Wynikiem jest histogram, na który nałożona jest krzywa gęstości.
Zaletą stosowania krzywej gęstości jest to, że podsumowuje ona kształt rozkładu za pomocą pojedynczej ciągłej krzywej.
Uwaga : pełną dokumentację funkcji seaborn displot() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak tworzyć inne popularne wykresy w Pythonie:
Jak tworzyć skumulowane wykresy słupkowe w Matplotlib
Jak utworzyć histogram częstotliwości względnej w Matplotlib
Jak stworzyć poziomy barplot w Seaborn