Как создать парный график в python


Парный график — это матрица диаграммы рассеяния, которая позволяет понять попарные отношения между различными переменными в наборе данных.

Самый простой способ создать парный график в Python — использовать функциюseaborn.pairplot(df) .

Следующие примеры показывают, как использовать эту функцию на практике.

Пример 1: Парный график для всех переменных

Следующий код показывает, как создать парный график для каждой числовой переменной в наборе данных seaborn под названием iris :

 import pandas as pd
import matplotlib. pyplot as plt
import seaborn as sns

#define dataset
iris = sns. load_dataset (“ iris ”)

#create pairs plot for all numeric variables
sns. pairplot (iris)

Построение пар в Python

Способ интерпретации матрицы следующий:

  • Распределение каждой переменной представлено в виде гистограммы по диагональным прямоугольникам.
  • Во всех остальных полях отображается диаграмма рассеяния взаимосвязей между каждой парной комбинацией переменных. Например, поле в левом нижнем углу матрицы показывает диаграмму рассеяния значений Petal_width и sepal_length .

Этот единственный график дает нам представление о взаимосвязи между каждой парой переменных в нашем наборе данных.

Пример 2. Построение пар для определенных переменных

Мы также можем указать только определенные переменные для включения в парный график:

 sns. pairplot (iris[[' sepal_length ', ' sepal_width ']])

Пример 3. Отображение пар с цветом по категориям

Мы также можем создать парный график, который раскрашивает каждую точку на каждом графике на основе категориальной переменной, используя аргумент оттенка :

 sns. pairplot (iris, hue=' species ') 

Построение пар в Python с цветом по категориям

Используя аргумент оттенка , мы можем лучше понять данные.

Дополнительные ресурсы

Как создавать гистограммы с помощью Seaborn
Как создать тепловые карты с помощью Seaborn
Как добавить заголовок к участкам Seaborn

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *