Как создать график распределения в matplotlib


Существует два распространенных способа создания диаграммы распределения в Python:

Метод 1. Создайте гистограмму с помощью Matplotlib

 import matplotlib. pyplot as plt

plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

Обратите внимание, что color управляет цветом заливки столбцов, ec управляет цветом краев столбцов, а bins управляет количеством интервалов в гистограмме.

Метод 2. Создайте гистограмму с кривой плотности с помощью Seaborn

 import seaborn as sns
sns. displot (data, kde= True , bins= 15 )

Обратите внимание, что kde=True указывает, что кривая плотности должна быть наложена на гистограмму.

Следующие примеры показывают, как использовать каждый метод на практике для визуализации распределения значений в следующем массиве NumPy:

 import numpy as np

#make this example reproducible.
n.p. random . seed ( 1 )

#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )

#view first five values
data[: 5 ]

array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])

Пример 1. Создайте гистограмму с помощью Matplotlib

Мы можем использовать следующий код для создания гистограммы в Matplotlib для визуализации распределения значений в массиве NumPy:

 import matplotlib. pyplot as plt

#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )

По оси X отображаются значения из массива NumPy, а по оси Y — частота этих значений.

Обратите внимание: чем больше значение, которое вы используете для аргумента интервалов , тем больше столбцов будет на гистограмме.

Пример 2. Создайте гистограмму с кривой плотности с помощью Seaborn.

Мы можем использовать следующий код для создания гистограммы с наложеннойкривой плотности с использованием библиотеки визуализации данных seaborn:

 import seaborn as sns

#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 ) 

В результате получается гистограмма, на которую накладывается кривая плотности.

Преимущество использования кривой плотности заключается в том, что она суммирует форму распределения с помощью одной непрерывной кривой.

Примечание . Полную документацию по функции seaborn displot() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как создавать другие распространенные диаграммы в Python:

Как создать гистограммы с накоплением в Matplotlib
Как создать гистограмму относительной частоты в Matplotlib
Как создать горизонтальную гистограмму в Seaborn

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *