Як створити діаграму пар у python
Парний графік — це матриця діаграми розсіювання, яка дозволяє зрозуміти попарний зв’язок між різними змінними в наборі даних.
Найпростіший спосіб створити діаграму пар у Python — скористатися функцієюseaborn.pairplot(df) .
Наступні приклади показують, як використовувати цю функцію на практиці.
Приклад 1: парний графік для всіх змінних
Наступний код показує, як створити попарний графік для кожної числової змінної в наборі даних seaborn під назвою iris :
import pandas as pd import matplotlib. pyplot as plt import seaborn as sns #define dataset iris = sns. load_dataset (“ iris ”) #create pairs plot for all numeric variables sns. pairplot (iris)
Спосіб інтерпретації матриці такий:
- Розподіл кожної змінної представлено у вигляді гістограми вздовж діагональних прямокутників.
- Усі інші поля відображають діаграму розсіювання зв’язку між кожною попарною комбінацією змінних. Наприклад, поле в нижньому лівому куті матриці показує діаграму розсіювання значень petal_width проти sepal_length .
Цей єдиний графік дає нам уявлення про зв’язок між кожною парою змінних у нашому наборі даних.
Приклад 2: Побудова пар для певних змінних
Ми також можемо вказати лише певні змінні для включення в парний графік:
sns. pairplot (iris[[' sepal_length ', ' sepal_width ']])
Приклад 3: Нанесення пар із кольором за категоріями
Ми також можемо створити парний графік, який забарвлює кожну точку на кожному графіку на основі категоріальної змінної за допомогою аргументу відтінку :
sns. pairplot (iris, hue=' species ')
Використовуючи аргумент відтінку , ми можемо краще зрозуміти дані.
Додаткові ресурси
Як створити барплоти за допомогою Seaborn
Як створити теплові карти за допомогою Seaborn
Як додати право власності на ділянки Seaborn