Pandas에서 분산형 매트릭스를 만드는 방법(예제 포함)
산점도 행렬은 말 그대로 산점도 행렬입니다.
이러한 유형의 행렬은 데이터 세트에 있는 여러 변수 간의 관계를 동시에 시각화할 수 있기 때문에 유용합니다.
Scatter_matrix() 함수를 사용하여 Pandas DataFrame에서 분산형 행렬을 만들 수 있습니다.
p.d. plotting . scatter_matrix (df)
다음 예는 다음 pandas DataFrame에서 실제로 이 구문을 사용하는 방법을 보여줍니다.
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (0) #createDataFrame df = pd. DataFrame ({' points ': np.random.randn(1000), ' assists ': np.random.randn(1000), ' rebounds ': np.random.randn(1000)}) #view first five rows of DataFrame df. head () points assists rebounds 0 1.764052 0.555963 -1.532921 1 0.400157 0.892474 -1.711970 2 0.978738 -0.422315 0.046135 3 2.240893 0.104714 -0.958374 4 1.867558 0.228053 -0.080812
예시 1: 기본 확산 매트릭스
다음 코드는 기본 분산 행렬을 생성하는 방법을 보여줍니다.
p.d. plotting . scatter_matrix (df)
예 2: 특정 열에 대한 분산형 행렬
다음 코드는 DataFrame의 처음 두 열에 대해서만 분산형 행렬을 만드는 방법을 보여줍니다.
p.d. plotting . scatter_matrix (df. iloc [:, 0:2])
예 3: 사용자 정의 색상 및 구간이 포함된 분산형 행렬
다음 코드는 사용자 정의 색상과 히스토그램에 대한 특정 수의 그룹을 사용하여 분산형 행렬을 만드는 방법을 보여줍니다.
p.d. plotting . scatter_matrix (df, color=' red ', hist_kwds={' bins ': 30 , 'color': ' red '})
예 4: KDE 플롯을 사용한 분산 행렬
다음 코드는 히스토그램 대신 행렬 대각선을 따라 커널 밀도 추정 플롯을 사용하여 분산 행렬을 생성하는 방법을 보여줍니다.
p.d. plotting . scatter_matrix (df, diagonal=' kde ')
여기에서 분산_매트릭스() 함수에 대한 전체 온라인 설명서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Python에서 다른 일반적인 차트를 만드는 방법을 설명합니다.
Python에서 열 지도를 만드는 방법
Python에서 종형 곡선을 만드는 방법
Python에서 Ogive 차트를 만드는 방법