Matplotlib에서 분포도를 만드는 방법
Python에서 분포 다이어그램을 만드는 두 가지 일반적인 방법이 있습니다.
방법 1: Matplotlib를 사용하여 히스토그램 만들기
import matplotlib. pyplot as plt
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
색상 은 막대의 채우기 색상을 제어하고, ec는 막대 가장자리의 색상을 제어하며, 빈은 히스토그램의 빈 수를 제어합니다.
방법 2: Seaborn을 사용하여 밀도 곡선이 포함된 히스토그램 만들기
import seaborn as sns
sns. displot (data, kde= True , bins= 15 )
kde=True 는 밀도 곡선이 히스토그램에 겹쳐져야 함을 지정합니다.
다음 예는 실제로 각 방법을 사용하여 다음 NumPy 배열의 값 분포를 시각화하는 방법을 보여줍니다.
import numpy as np
#make this example reproducible.
n.p. random . seed ( 1 )
#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )
#view first five values
data[: 5 ]
array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])
예제 1: Matplotlib를 사용하여 히스토그램 만들기
다음 코드를 사용하여 Matplotlib에서 히스토그램을 생성하여 NumPy 배열의 값 분포를 시각화할 수 있습니다.
import matplotlib. pyplot as plt
#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
x축은 NumPy 배열의 값을 표시하고 y축은 이러한 값의 빈도를 표시합니다.
bins 인수에 사용하는 값이 클수록 히스토그램에 더 많은 막대가 표시됩니다.
예 2: Seaborn을 사용하여 밀도 곡선이 포함된 히스토그램 만들기
다음 코드를 사용하여 seaborn 데이터 시각화 라이브러리를 사용하여 밀도 곡선이 겹쳐진 히스토그램을 만들 수 있습니다.
import seaborn as sns
#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 )
결과는 밀도 곡선이 겹쳐진 히스토그램입니다.
밀도 곡선을 사용하면 단일 연속 곡선을 사용하여 분포의 모양을 요약할 수 있다는 장점이 있습니다.
참고 : 여기에서 seaborn displot() 함수에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Python에서 다른 일반적인 차트를 만드는 방법을 설명합니다.
Matplotlib에서 누적 막대 차트를 만드는 방법
Matplotlib에서 상대 빈도 히스토그램을 만드는 방법
Seaborn에서 수평 막대 그래프를 만드는 방법