Как создать график распределения в matplotlib
Существует два распространенных способа создания диаграммы распределения в Python:
Метод 1. Создайте гистограмму с помощью Matplotlib
import matplotlib. pyplot as plt
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
Обратите внимание, что color управляет цветом заливки столбцов, ec управляет цветом краев столбцов, а bins управляет количеством интервалов в гистограмме.
Метод 2. Создайте гистограмму с кривой плотности с помощью Seaborn
import seaborn as sns
sns. displot (data, kde= True , bins= 15 )
Обратите внимание, что kde=True указывает, что кривая плотности должна быть наложена на гистограмму.
Следующие примеры показывают, как использовать каждый метод на практике для визуализации распределения значений в следующем массиве NumPy:
import numpy as np
#make this example reproducible.
n.p. random . seed ( 1 )
#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )
#view first five values
data[: 5 ]
array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])
Пример 1. Создайте гистограмму с помощью Matplotlib
Мы можем использовать следующий код для создания гистограммы в Matplotlib для визуализации распределения значений в массиве NumPy:
import matplotlib. pyplot as plt
#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
По оси X отображаются значения из массива NumPy, а по оси Y — частота этих значений.
Обратите внимание: чем больше значение, которое вы используете для аргумента интервалов , тем больше столбцов будет на гистограмме.
Пример 2. Создайте гистограмму с кривой плотности с помощью Seaborn.
Мы можем использовать следующий код для создания гистограммы с наложеннойкривой плотности с использованием библиотеки визуализации данных seaborn:
import seaborn as sns
#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 )
В результате получается гистограмма, на которую накладывается кривая плотности.
Преимущество использования кривой плотности заключается в том, что она суммирует форму распределения с помощью одной непрерывной кривой.
Примечание . Полную документацию по функции seaborn displot() можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как создавать другие распространенные диаграммы в Python:
Как создать гистограммы с накоплением в Matplotlib
Как создать гистограмму относительной частоты в Matplotlib
Как создать горизонтальную гистограмму в Seaborn