Python에서 로지스틱 회귀 곡선을 그리는 방법


Seaborn 데이터 시각화 라이브러리의 regplot() 함수를 사용하여 Python에서 로지스틱 회귀 곡선을 그릴 수 있습니다.

 import seaborn as sns

sns. regplot (x=x, y=y, data=df, logistic= True , ci= None )

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Python에서 로지스틱 회귀 곡선 그리기

이 예에서는 Introduction to Statistical Learning 책기본 데이터세트를 사용합니다. 다음 코드를 사용하여 데이터세트 요약을 로드하고 표시할 수 있습니다.

 #import dataset from CSV file on Github
url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/default.csv"
data = pd. read_csv (url)

#view first six rows of dataset
data[0:6]

        default student balance income
0 0 0 729.526495 44361.625074
1 0 1 817.180407 12106.134700
2 0 0 1073.549164 31767.138947
3 0 0 529.250605 35704.493935
4 0 0 785.655883 38463.495879
5 0 1 919.588530 7491.558572  

이 데이터 세트에는 10,000명의 개인에 대한 다음 정보가 포함되어 있습니다.

  • 기본값: 개인이 채무 불이행을 했는지 여부를 나타냅니다.
  • 학생: 개인이 학생인지 여부를 나타냅니다.
  • 잔액: 개인이 보유하고 있는 평균 잔액입니다.
  • 소득: 개인의 소득.

특정 개인이 채무를 불이행할 확률을 예측하기 위해 “균형”을 사용하는 로지스틱 회귀 모델을 구축한다고 가정해 보겠습니다.

다음 코드를 사용하여 로지스틱 회귀 곡선을 그릴 수 있습니다.

 #define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']

#plot logistic regression curve
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ) 

x축은 예측변수 ‘균형’의 값을 나타내고, y축은 예측된 부도확률을 나타낸다.

우리는 더 높은 균형 가치가 개인이 채무를 불이행할 확률이 더 높다는 것을 분명히 볼 수 있습니다.

Scatter_kwsline_kws를 사용하여 플롯의 점과 곡선의 색상을 변경할 수도 있습니다.

 #define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']

#plot logistic regression curve with black points and red line
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ),
            scatter_kws={' color ': ' black '}, line_kws={' color ': ' red '}) 

Python의 로지스틱 회귀 곡선

플롯에서 원하는 색상을 자유롭게 선택하십시오.

추가 리소스

다음 자습서에서는 로지스틱 회귀에 대한 추가 정보를 제공합니다.

로지스틱 회귀 소개
로지스틱 회귀 결과를 보고하는 방법
Python에서 로지스틱 회귀를 수행하는 방법(단계별)

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다