Python'da lojistik regresyon eğrisi nasıl çizilir
Python’da bir lojistik regresyon eğrisi çizmek için seaborn veri görselleştirme kütüphanesinin regplot() fonksiyonunu kullanabilirsiniz:
import seaborn as sns sns. regplot (x=x, y=y, data=df, logistic= True , ci= None )
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: Python’da lojistik regresyon eğrisi çizmek
Bu örnek için, Introduction to Statistical Learning kitabındaki varsayılan veri kümesini kullanacağız. Veri kümesinin özetini yüklemek ve görüntülemek için aşağıdaki kodu kullanabiliriz:
#import dataset from CSV file on Github url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/default.csv" data = pd. read_csv (url) #view first six rows of dataset data[0:6] default student balance income 0 0 0 729.526495 44361.625074 1 0 1 817.180407 12106.134700 2 0 0 1073.549164 31767.138947 3 0 0 529.250605 35704.493935 4 0 0 785.655883 38463.495879 5 0 1 919.588530 7491.558572
Bu veri seti 10.000 kişiye ilişkin aşağıdaki bilgileri içermektedir:
- Varsayılan: Bir kişinin temerrüde düşüp düşmediğini gösterir.
- Öğrenci: Bireyin öğrenci olup olmadığını belirtir.
- bakiye: Bir bireyin taşıdığı ortalama bakiye.
- gelir: Bireyin geliri.
Belirli bir bireyin temerrüde düşme olasılığını tahmin etmek için “dengeyi” kullanan bir lojistik regresyon modeli oluşturmak istediğimizi varsayalım.
Lojistik regresyon eğrisini çizmek için aşağıdaki kodu kullanabiliriz:
#define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']
#plot logistic regression curve
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None )
X ekseni tahmin değişkeni “bakiye”nin değerlerini gösterirken, y ekseni öngörülen temerrüt olasılığını gösterir.
Daha yüksek denge değerlerinin, bireyin temerrüde düşme olasılığının daha yüksek olmasıyla ilişkili olduğunu açıkça görebiliriz.
Grafikteki noktaların ve eğrinin renklerini değiştirmek için scatter_kws ve line_kws komutlarını da kullanabileceğinizi unutmayın:
#define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']
#plot logistic regression curve with black points and red line
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ),
scatter_kws={' color ': ' black '}, line_kws={' color ': ' red '})
Arsadaki istediğiniz renkleri seçmekten çekinmeyin.
Ek kaynaklar
Aşağıdaki eğitimler lojistik regresyon hakkında ek bilgi sağlar:
Lojistik Regresyona Giriş
Lojistik regresyon sonuçları nasıl raporlanır?
Python’da Lojistik Regresyon Nasıl Gerçekleştirilir (Adım Adım)