Як створити діаграму розподілу в matplotlib


Існує два поширених способи створення діаграми розподілу в Python:

Спосіб 1: Створення гістограми за допомогою Matplotlib

 import matplotlib. pyplot as plt

plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

Зауважте, що color контролює колір заливки смужок, ec контролює колір країв смуги, а bins контролює кількість бінів на гістограмі.

Спосіб 2: Створення гістограми з кривою щільності за допомогою Seaborn

 import seaborn as sns
sns. displot (data, kde= True , bins= 15 )

Зауважте, що kde=True вказує, що на гістограму має бути накладено криву щільності.

У наступних прикладах показано, як використовувати кожен метод на практиці для візуалізації розподілу значень у наступному масиві NumPy:

 import numpy as np

#make this example reproducible.
n.p. random . seed ( 1 )

#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )

#view first five values
data[: 5 ]

array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])

Приклад 1: створення гістограми за допомогою Matplotlib

Ми можемо використовувати наступний код для створення гістограми в Matplotlib для візуалізації розподілу значень у масиві NumPy:

 import matplotlib. pyplot as plt

#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

На осі абсцис відображаються значення з масиву NumPy, а на осі у – частота цих значень.

Зауважте, що чим більше значення ви використовуєте для аргументу bins , тим більше стовпчиків буде на гістограмі.

Приклад 2: Створення гістограми з кривою щільності за допомогою Seaborn

Ми можемо використати наступний код, щоб створити гістограму з накладеною кривою щільності за допомогою бібліотеки візуалізації даних seaborn:

 import seaborn as sns

#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 ) 

У результаті виходить гістограма, на яку накладається крива щільності.

Перевага використання кривої щільності полягає в тому, що вона підсумовує форму розподілу за допомогою однієї безперервної кривої.

Примітка . Ви можете знайти повну документацію для функції seaborn displot() тут .

Додаткові ресурси

У наступних посібниках пояснюється, як створювати інші типові діаграми в Python:

Як створити стовпчасту діаграму з накопиченням у Matplotlib
Як створити гістограму відносної частоти в Matplotlib
Як створити горизонтальну бардіографію в Seaborn

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *