Pandas에서 분산형 매트릭스를 만드는 방법(예제 포함)


산점도 행렬은 말 그대로 산점도 행렬입니다.

이러한 유형의 행렬은 데이터 세트에 있는 여러 변수 간의 관계를 동시에 시각화할 수 있기 때문에 유용합니다.

Scatter_matrix() 함수를 사용하여 Pandas DataFrame에서 분산형 행렬을 만들 수 있습니다.

 p.d. plotting . scatter_matrix (df)

다음 예는 다음 pandas DataFrame에서 실제로 이 구문을 사용하는 방법을 보여줍니다.

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (0)

#createDataFrame
df = pd. DataFrame ({' points ': np.random.randn(1000),
                   ' assists ': np.random.randn(1000),
                   ' rebounds ': np.random.randn(1000)})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 1.764052 0.555963 -1.532921
1 0.400157 0.892474 -1.711970
2 0.978738 -0.422315 0.046135
3 2.240893 0.104714 -0.958374
4 1.867558 0.228053 -0.080812

예시 1: 기본 확산 매트릭스

다음 코드는 기본 분산 행렬을 생성하는 방법을 보여줍니다.

 p.d. plotting . scatter_matrix (df)

팬더의 분산 매트릭스

예 2: 특정 열에 대한 분산형 행렬

다음 코드는 DataFrame의 처음 두 열에 대해서만 분산형 행렬을 만드는 방법을 보여줍니다.

 p.d. plotting . scatter_matrix (df. iloc [:, 0:2])

예 3: 사용자 정의 색상 및 구간이 포함된 분산형 행렬

다음 코드는 사용자 정의 색상과 히스토그램에 대한 특정 수의 그룹을 사용하여 분산형 행렬을 만드는 방법을 보여줍니다.

 p.d. plotting . scatter_matrix (df, color=' red ', hist_kwds={' bins ': 30 , 'color': ' red '})

사용자 정의 색상이 포함된 팬더 분산형 행렬

예 4: KDE 플롯을 사용한 분산 행렬

다음 코드는 히스토그램 대신 행렬 대각선을 따라 커널 밀도 추정 플롯을 사용하여 분산 행렬을 생성하는 방법을 보여줍니다.

 p.d. plotting . scatter_matrix (df, diagonal=' kde ')

여기에서 분산_매트릭스() 함수에 대한 전체 온라인 설명서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Python에서 다른 일반적인 차트를 만드는 방법을 설명합니다.

Python에서 열 지도를 만드는 방법
Python에서 종형 곡선을 만드는 방법
Python에서 Ogive 차트를 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다