So zeichnen sie eine logistische regressionskurve in python
Sie können die Funktion regplot() der Seaborn-Datenvisualisierungsbibliothek verwenden, um eine logistische Regressionskurve in Python zu zeichnen:
import seaborn as sns sns. regplot (x=x, y=y, data=df, logistic= True , ci= None )
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Zeichnen einer logistischen Regressionskurve in Python
Für dieses Beispiel verwenden wir den Standarddatensatz aus dem Buch Introduction to Statistical Learning . Mit dem folgenden Code können wir eine Zusammenfassung des Datensatzes laden und anzeigen:
#import dataset from CSV file on Github url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/default.csv" data = pd. read_csv (url) #view first six rows of dataset data[0:6] default student balance income 0 0 0 729.526495 44361.625074 1 0 1 817.180407 12106.134700 2 0 0 1073.549164 31767.138947 3 0 0 529.250605 35704.493935 4 0 0 785.655883 38463.495879 5 0 1 919.588530 7491.558572
Dieser Datensatz enthält die folgenden Informationen zu 10.000 Personen:
- Standard: Gibt an, ob eine Person in Verzug geraten ist oder nicht.
- Student: gibt an, ob eine Person Student ist oder nicht.
- Guthaben: Durchschnittliches Guthaben einer Person.
- Einkommen: Einkommen des Einzelnen.
Angenommen, wir möchten ein logistisches Regressionsmodell erstellen, das „Balance“ verwendet, um die Wahrscheinlichkeit vorherzusagen, dass eine bestimmte Person zahlungsunfähig wird.
Mit dem folgenden Code können wir eine logistische Regressionskurve zeichnen:
#define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']
#plot logistic regression curve
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None )
Die x-Achse zeigt die Werte der Prädiktorvariablen „Balance“ und die y-Achse zeigt die prognostizierte Ausfallwahrscheinlichkeit.
Wir können deutlich erkennen, dass höhere Gleichgewichtswerte mit höheren Wahrscheinlichkeiten für einen Zahlungsausfall einer Person verbunden sind.
Beachten Sie, dass Sie auch „scatter_kws“ und „line_kws“ verwenden können, um die Farben der Punkte und der Kurve im Diagramm zu ändern:
#define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']
#plot logistic regression curve with black points and red line
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ),
scatter_kws={' color ': ' black '}, line_kws={' color ': ' red '})
Fühlen Sie sich frei, die Farben zu wählen, die Sie im Plot haben möchten.
Zusätzliche Ressourcen
Die folgenden Tutorials bieten zusätzliche Informationen zur logistischen Regression:
Einführung in die logistische Regression
So melden Sie Ergebnisse der logistischen Regression
So führen Sie eine logistische Regression in Python durch (Schritt für Schritt)