Python'da lojistik regresyon eğrisi nasıl çizilir


Python’da bir lojistik regresyon eğrisi çizmek için seaborn veri görselleştirme kütüphanesinin regplot() fonksiyonunu kullanabilirsiniz:

 import seaborn as sns

sns. regplot (x=x, y=y, data=df, logistic= True , ci= None )

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: Python’da lojistik regresyon eğrisi çizmek

Bu örnek için, Introduction to Statistical Learning kitabındaki varsayılan veri kümesini kullanacağız. Veri kümesinin özetini yüklemek ve görüntülemek için aşağıdaki kodu kullanabiliriz:

 #import dataset from CSV file on Github
url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/default.csv"
data = pd. read_csv (url)

#view first six rows of dataset
data[0:6]

        default student balance income
0 0 0 729.526495 44361.625074
1 0 1 817.180407 12106.134700
2 0 0 1073.549164 31767.138947
3 0 0 529.250605 35704.493935
4 0 0 785.655883 38463.495879
5 0 1 919.588530 7491.558572  

Bu veri seti 10.000 kişiye ilişkin aşağıdaki bilgileri içermektedir:

  • Varsayılan: Bir kişinin temerrüde düşüp düşmediğini gösterir.
  • Öğrenci: Bireyin öğrenci olup olmadığını belirtir.
  • bakiye: Bir bireyin taşıdığı ortalama bakiye.
  • gelir: Bireyin geliri.

Belirli bir bireyin temerrüde düşme olasılığını tahmin etmek için “dengeyi” kullanan bir lojistik regresyon modeli oluşturmak istediğimizi varsayalım.

Lojistik regresyon eğrisini çizmek için aşağıdaki kodu kullanabiliriz:

 #define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']

#plot logistic regression curve
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ) 

X ekseni tahmin değişkeni “bakiye”nin değerlerini gösterirken, y ekseni öngörülen temerrüt olasılığını gösterir.

Daha yüksek denge değerlerinin, bireyin temerrüde düşme olasılığının daha yüksek olmasıyla ilişkili olduğunu açıkça görebiliriz.

Grafikteki noktaların ve eğrinin renklerini değiştirmek için scatter_kws ve line_kws komutlarını da kullanabileceğinizi unutmayın:

 #define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']

#plot logistic regression curve with black points and red line
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ),
            scatter_kws={' color ': ' black '}, line_kws={' color ': ' red '}) 

Python'da lojistik regresyon eğrisi

Arsadaki istediğiniz renkleri seçmekten çekinmeyin.

Ek kaynaklar

Aşağıdaki eğitimler lojistik regresyon hakkında ek bilgi sağlar:

Lojistik Regresyona Giriş
Lojistik regresyon sonuçları nasıl raporlanır?
Python’da Lojistik Regresyon Nasıl Gerçekleştirilir (Adım Adım)

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir