Cara memplot kurva regresi logistik dengan python


Anda dapat menggunakan fungsi regplot() dari pustaka visualisasi data seaborn untuk memplot kurva regresi logistik dengan Python:

 import seaborn as sns

sns. regplot (x=x, y=y, data=df, logistic= True , ci= None )

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: memplot kurva regresi logistik dengan Python

Untuk contoh ini, kita akan menggunakan dataset default dari buku Pengantar Pembelajaran Statistik . Kita dapat menggunakan kode berikut untuk memuat dan menampilkan ringkasan kumpulan data:

 #import dataset from CSV file on Github
url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/default.csv"
data = pd. read_csv (url)

#view first six rows of dataset
data[0:6]

        default student balance income
0 0 0 729.526495 44361.625074
1 0 1 817.180407 12106.134700
2 0 0 1073.549164 31767.138947
3 0 0 529.250605 35704.493935
4 0 0 785.655883 38463.495879
5 0 1 919.588530 7491.558572  

Kumpulan data ini berisi informasi berikut tentang 10.000 individu:

  • default: menunjukkan apakah seseorang mengalami default atau tidak.
  • pelajar: menunjukkan apakah seseorang adalah pelajar atau bukan.
  • saldo: Saldo rata-rata yang dibawa oleh seorang individu.
  • pendapatan: Pendapatan individu.

Misalkan kita ingin membuat model regresi logistik yang menggunakan “keseimbangan” untuk memprediksi kemungkinan individu tertentu akan gagal bayar.

Kita dapat menggunakan kode berikut untuk memplot kurva regresi logistik:

 #define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']

#plot logistic regression curve
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ) 

Sumbu x menunjukkan nilai variabel prediktor “keseimbangan” dan sumbu y menampilkan prediksi probabilitas default.

Kita dapat dengan jelas melihat bahwa nilai keseimbangan yang lebih tinggi dikaitkan dengan kemungkinan yang lebih tinggi bahwa seseorang akan gagal bayar.

Perhatikan bahwa Anda juga dapat menggunakan scatter_kws dan line_kws untuk mengubah warna titik dan kurva pada plot:

 #define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']

#plot logistic regression curve with black points and red line
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ),
            scatter_kws={' color ': ' black '}, line_kws={' color ': ' red '}) 

kurva regresi logistik dengan Python

Jangan ragu untuk memilih warna yang Anda inginkan dalam plot.

Sumber daya tambahan

Tutorial berikut memberikan informasi tambahan tentang regresi logistik:

Pengantar Regresi Logistik
Cara melaporkan hasil regresi logistik
Cara Melakukan Regresi Logistik dengan Python (Langkah demi Langkah)

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *