Python에서 회귀선을 사용하여 산점도를 만드는 방법


간단한 선형 회귀를 수행할 때 산점도를 생성하여 x 및 y 값의 다양한 조합과 추정 회귀선을 시각화하려는 경우가 종종 있습니다.

다행히도 Python에서 이러한 유형의 플롯을 만드는 두 가지 쉬운 방법이 있습니다. 이 튜토리얼에서는 다음 데이터를 사용하여 두 가지 방법을 모두 설명합니다.

 import numpy as np 

#createdata
x = np.array([1, 1, 2, 3, 4, 4, 5, 6, 7, 7, 8, 9])
y = np.array([13, 14, 17, 12, 23, 24, 25, 25, 24, 28, 32, 33])

방법 1: Matplotlib 사용

다음 코드는 Matplotlib를 사용하여 이 데이터에 대한 추정 회귀선이 포함된 산점도를 생성하는 방법을 보여줍니다.

 import matplotlib.pyplot as plt

#create basic scatterplot
plt.plot(x, y, 'o')

#obtain m (slope) and b(intercept) of linear regression line
m, b = np.polyfit(x, y, 1)

#add linear regression line to scatterplot 
plt.plot(x, m*x+b) 

Python에서 회귀선이 있는 산점도

원하는 대로 차트의 색상을 자유롭게 변경할 수 있습니다. 예를 들어 개별 점을 녹색으로, 선을 빨간색으로 변경하는 방법은 다음과 같습니다.

 #use green as color for individual points
plt.plot(x, y, 'o', color=' green ')

#obtain m (slope) and b(intercept) of linear regression line
m, b = np.polyfit(x, y, 1)

#use red as color for regression line
plt.plot(x, m*x+b, color=' red ') 

numpy의 회귀선이 있는 산점도

방법 2: Seaborn 사용

Seaborn 시각화 라이브러리의 regplot() 함수를 사용하여 회귀선이 있는 산점도를 생성할 수도 있습니다.

 import seaborn as sns

#create scatterplot with regression line
sns.regplot(x, y, ci=None) 

Seaborn Python의 회귀선이 있는 산점도

ci=None 은 Seaborn에게 플롯에서 신뢰 구간 대역을 숨기도록 지시합니다. 그러나 원하는 경우 표시하도록 선택할 수 있습니다.

 import seaborn as sns

#create scatterplot with regression line and confidence interval lines
sns.regplot(x,y) 

regplot() 함수에 대한 전체 문서는 여기에서 찾을 수 있습니다.

추가 리소스

Python에서 단순 선형 회귀를 수행하는 방법
Python에서 잔차 플롯을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다