So zeichnen sie eine logistische regressionskurve in python


Sie können die Funktion regplot() der Seaborn-Datenvisualisierungsbibliothek verwenden, um eine logistische Regressionskurve in Python zu zeichnen:

 import seaborn as sns

sns. regplot (x=x, y=y, data=df, logistic= True , ci= None )

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Zeichnen einer logistischen Regressionskurve in Python

Für dieses Beispiel verwenden wir den Standarddatensatz aus dem Buch Introduction to Statistical Learning . Mit dem folgenden Code können wir eine Zusammenfassung des Datensatzes laden und anzeigen:

 #import dataset from CSV file on Github
url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/default.csv"
data = pd. read_csv (url)

#view first six rows of dataset
data[0:6]

        default student balance income
0 0 0 729.526495 44361.625074
1 0 1 817.180407 12106.134700
2 0 0 1073.549164 31767.138947
3 0 0 529.250605 35704.493935
4 0 0 785.655883 38463.495879
5 0 1 919.588530 7491.558572  

Dieser Datensatz enthält die folgenden Informationen zu 10.000 Personen:

  • Standard: Gibt an, ob eine Person in Verzug geraten ist oder nicht.
  • Student: gibt an, ob eine Person Student ist oder nicht.
  • Guthaben: Durchschnittliches Guthaben einer Person.
  • Einkommen: Einkommen des Einzelnen.

Angenommen, wir möchten ein logistisches Regressionsmodell erstellen, das „Balance“ verwendet, um die Wahrscheinlichkeit vorherzusagen, dass eine bestimmte Person zahlungsunfähig wird.

Mit dem folgenden Code können wir eine logistische Regressionskurve zeichnen:

 #define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']

#plot logistic regression curve
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ) 

Die x-Achse zeigt die Werte der Prädiktorvariablen „Balance“ und die y-Achse zeigt die prognostizierte Ausfallwahrscheinlichkeit.

Wir können deutlich erkennen, dass höhere Gleichgewichtswerte mit höheren Wahrscheinlichkeiten für einen Zahlungsausfall einer Person verbunden sind.

Beachten Sie, dass Sie auch „scatter_kws“ und „line_kws“ verwenden können, um die Farben der Punkte und der Kurve im Diagramm zu ändern:

 #define the predictor variable and the response variable
x = data[' balance ']
y = data[' default ']

#plot logistic regression curve with black points and red line
sns. regplot (x=x, y=y, data=data, logistic= True , ci= None ),
            scatter_kws={' color ': ' black '}, line_kws={' color ': ' red '}) 

Logistische Regressionskurve in Python

Fühlen Sie sich frei, die Farben zu wählen, die Sie im Plot haben möchten.

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zur logistischen Regression:

Einführung in die logistische Regression
So melden Sie Ergebnisse der logistischen Regression
So führen Sie eine logistische Regression in Python durch (Schritt für Schritt)

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert