Python에서 쌍 도표를 만드는 방법


쌍 도표는 데이터 세트에 있는 다양한 변수 간의 쌍별 관계를 이해할 수 있는 산점도 행렬입니다.

Python에서 쌍 도표를 만드는 가장 쉬운 방법은seaborn.pairplot(df) 함수를 사용하는 것입니다.

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

예 1: 모든 변수에 대한 쌍 도표

다음 코드는 iris 라는 seaborn 데이터세트의 각 숫자 변수에 대한 쌍별 플롯을 생성하는 방법을 보여줍니다.

 import pandas as pd
import matplotlib. pyplot as plt
import seaborn as sns

#define dataset
iris = sns. load_dataset (“ iris ”)

#create pairs plot for all numeric variables
sns. pairplot (iris)

Python에서 쌍 그리기

행렬을 해석하는 방법은 다음과 같습니다.

  • 각 변수의 분포는 대각선 상자를 따라 히스토그램으로 표시됩니다.
  • 다른 모든 상자에는 각 쌍별 변수 조합 간의 관계에 대한 산점도가 표시됩니다. 예를 들어, 행렬의 왼쪽 아래 모서리에 있는 상자에는 petal_widthsepal_length 값의 산점도가 표시됩니다.

이 단일 그래프는 데이터 세트의 각 변수 쌍 간의 관계에 대한 아이디어를 제공합니다.

예 2: 특정 변수에 대한 쌍 그리기

또한 쌍 도표에 포함할 특정 변수만 지정할 수도 있습니다.

 sns. pairplot (iris[[' sepal_length ', ' sepal_width ']])

예 3: 카테고리별 색상으로 쌍 그리기

또한 색상 인수를 사용하여 범주형 변수를 기반으로 각 플롯의 각 점을 색칠하는 쌍 플롯을 만들 수도 있습니다.

 sns. pairplot (iris, hue=' species ') 

카테고리별 색상으로 Python에서 쌍 그리기

색상 인수를 사용하면 데이터를 더 잘 이해할 수 있습니다.

추가 리소스

Seaborn으로 막대 그래프를 만드는 방법
Seaborn으로 히트맵을 만드는 방법
Seaborn 플롯에 제목을 추가하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다