Как создать парный график в python
Парный график — это матрица диаграммы рассеяния, которая позволяет понять попарные отношения между различными переменными в наборе данных.
Самый простой способ создать парный график в Python — использовать функциюseaborn.pairplot(df) .
Следующие примеры показывают, как использовать эту функцию на практике.
Пример 1: Парный график для всех переменных
Следующий код показывает, как создать парный график для каждой числовой переменной в наборе данных seaborn под названием iris :
import pandas as pd import matplotlib. pyplot as plt import seaborn as sns #define dataset iris = sns. load_dataset (“ iris ”) #create pairs plot for all numeric variables sns. pairplot (iris)
Способ интерпретации матрицы следующий:
- Распределение каждой переменной представлено в виде гистограммы по диагональным прямоугольникам.
- Во всех остальных полях отображается диаграмма рассеяния взаимосвязей между каждой парной комбинацией переменных. Например, поле в левом нижнем углу матрицы показывает диаграмму рассеяния значений Petal_width и sepal_length .
Этот единственный график дает нам представление о взаимосвязи между каждой парой переменных в нашем наборе данных.
Пример 2. Построение пар для определенных переменных
Мы также можем указать только определенные переменные для включения в парный график:
sns. pairplot (iris[[' sepal_length ', ' sepal_width ']])
Пример 3. Отображение пар с цветом по категориям
Мы также можем создать парный график, который раскрашивает каждую точку на каждом графике на основе категориальной переменной, используя аргумент оттенка :
sns. pairplot (iris, hue=' species ')
Используя аргумент оттенка , мы можем лучше понять данные.
Дополнительные ресурсы
Как создавать гистограммы с помощью Seaborn
Как создать тепловые карты с помощью Seaborn
Как добавить заголовок к участкам Seaborn