Python에서 회귀선을 사용하여 산점도를 만드는 방법
간단한 선형 회귀를 수행할 때 산점도를 생성하여 x 및 y 값의 다양한 조합과 추정 회귀선을 시각화하려는 경우가 종종 있습니다.
다행히도 Python에서 이러한 유형의 플롯을 만드는 두 가지 쉬운 방법이 있습니다. 이 튜토리얼에서는 다음 데이터를 사용하여 두 가지 방법을 모두 설명합니다.
import numpy as np
#createdata
x = np.array([1, 1, 2, 3, 4, 4, 5, 6, 7, 7, 8, 9])
y = np.array([13, 14, 17, 12, 23, 24, 25, 25, 24, 28, 32, 33])
방법 1: Matplotlib 사용
다음 코드는 Matplotlib를 사용하여 이 데이터에 대한 추정 회귀선이 포함된 산점도를 생성하는 방법을 보여줍니다.
import matplotlib.pyplot as plt #create basic scatterplot plt.plot(x, y, 'o') #obtain m (slope) and b(intercept) of linear regression line m, b = np.polyfit(x, y, 1) #add linear regression line to scatterplot plt.plot(x, m*x+b)
원하는 대로 차트의 색상을 자유롭게 변경할 수 있습니다. 예를 들어 개별 점을 녹색으로, 선을 빨간색으로 변경하는 방법은 다음과 같습니다.
#use green as color for individual points plt.plot(x, y, 'o', color=' green ') #obtain m (slope) and b(intercept) of linear regression line m, b = np.polyfit(x, y, 1) #use red as color for regression line plt.plot(x, m*x+b, color=' red ')
방법 2: Seaborn 사용
Seaborn 시각화 라이브러리의 regplot() 함수를 사용하여 회귀선이 있는 산점도를 생성할 수도 있습니다.
import seaborn as sns #create scatterplot with regression line sns.regplot(x, y, ci=None)
ci=None 은 Seaborn에게 플롯에서 신뢰 구간 대역을 숨기도록 지시합니다. 그러나 원하는 경우 표시하도록 선택할 수 있습니다.
import seaborn as sns #create scatterplot with regression line and confidence interval lines sns.regplot(x,y)
regplot() 함수에 대한 전체 문서는 여기에서 찾을 수 있습니다.