Як створити діаграму розподілу в matplotlib
Існує два поширених способи створення діаграми розподілу в Python:
Спосіб 1: Створення гістограми за допомогою Matplotlib
import matplotlib. pyplot as plt
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
Зауважте, що color контролює колір заливки смужок, ec контролює колір країв смуги, а bins контролює кількість бінів на гістограмі.
Спосіб 2: Створення гістограми з кривою щільності за допомогою Seaborn
import seaborn as sns
sns. displot (data, kde= True , bins= 15 )
Зауважте, що kde=True вказує, що на гістограму має бути накладено криву щільності.
У наступних прикладах показано, як використовувати кожен метод на практиці для візуалізації розподілу значень у наступному масиві NumPy:
import numpy as np
#make this example reproducible.
n.p. random . seed ( 1 )
#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )
#view first five values
data[: 5 ]
array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])
Приклад 1: створення гістограми за допомогою Matplotlib
Ми можемо використовувати наступний код для створення гістограми в Matplotlib для візуалізації розподілу значень у масиві NumPy:
import matplotlib. pyplot as plt
#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
На осі абсцис відображаються значення з масиву NumPy, а на осі у – частота цих значень.
Зауважте, що чим більше значення ви використовуєте для аргументу bins , тим більше стовпчиків буде на гістограмі.
Приклад 2: Створення гістограми з кривою щільності за допомогою Seaborn
Ми можемо використати наступний код, щоб створити гістограму з накладеною кривою щільності за допомогою бібліотеки візуалізації даних seaborn:
import seaborn as sns
#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 )
У результаті виходить гістограма, на яку накладається крива щільності.
Перевага використання кривої щільності полягає в тому, що вона підсумовує форму розподілу за допомогою однієї безперервної кривої.
Примітка . Ви можете знайти повну документацію для функції seaborn displot() тут .
Додаткові ресурси
У наступних посібниках пояснюється, як створювати інші типові діаграми в Python:
Як створити стовпчасту діаграму з накопиченням у Matplotlib
Як створити гістограму відносної частоти в Matplotlib
Як створити горизонтальну бардіографію в Seaborn