Як створити діаграму пар у python


Парний графік — це матриця діаграми розсіювання, яка дозволяє зрозуміти попарний зв’язок між різними змінними в наборі даних.

Найпростіший спосіб створити діаграму пар у Python — скористатися функцієюseaborn.pairplot(df) .

Наступні приклади показують, як використовувати цю функцію на практиці.

Приклад 1: парний графік для всіх змінних

Наступний код показує, як створити попарний графік для кожної числової змінної в наборі даних seaborn під назвою iris :

 import pandas as pd
import matplotlib. pyplot as plt
import seaborn as sns

#define dataset
iris = sns. load_dataset (“ iris ”)

#create pairs plot for all numeric variables
sns. pairplot (iris)

Побудова пар у Python

Спосіб інтерпретації матриці такий:

  • Розподіл кожної змінної представлено у вигляді гістограми вздовж діагональних прямокутників.
  • Усі інші поля відображають діаграму розсіювання зв’язку між кожною попарною комбінацією змінних. Наприклад, поле в нижньому лівому куті матриці показує діаграму розсіювання значень petal_width проти sepal_length .

Цей єдиний графік дає нам уявлення про зв’язок між кожною парою змінних у нашому наборі даних.

Приклад 2: Побудова пар для певних змінних

Ми також можемо вказати лише певні змінні для включення в парний графік:

 sns. pairplot (iris[[' sepal_length ', ' sepal_width ']])

Приклад 3: Нанесення пар із кольором за категоріями

Ми також можемо створити парний графік, який забарвлює кожну точку на кожному графіку на основі категоріальної змінної за допомогою аргументу відтінку :

 sns. pairplot (iris, hue=' species ') 

Побудова пар у Python із кольором за категоріями

Використовуючи аргумент відтінку , ми можемо краще зрозуміти дані.

Додаткові ресурси

Як створити барплоти за допомогою Seaborn
Як створити теплові карти за допомогою Seaborn
Як додати право власності на ділянки Seaborn

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *