So erstellen sie ein streudiagramm mit einer regressionslinie in python


Wenn Sie eine einfache lineare Regression durchführen, möchten Sie möglicherweise häufig ein Streudiagramm erstellen, um die verschiedenen Kombinationen von x- und y-Werten sowie die geschätzte Regressionslinie zu visualisieren.

Glücklicherweise gibt es zwei einfache Möglichkeiten, diese Art von Diagramm in Python zu erstellen. In diesem Tutorial werden beide Methoden anhand der folgenden Daten erläutert:

 import numpy as np 

#createdata
x = np.array([1, 1, 2, 3, 4, 4, 5, 6, 7, 7, 8, 9])
y = np.array([13, 14, 17, 12, 23, 24, 25, 25, 24, 28, 32, 33])

Methode 1: Verwenden Sie Matplotlib

Der folgende Code zeigt, wie man mit Matplotlib ein Streudiagramm mit einer geschätzten Regressionslinie für diese Daten erstellt:

 import matplotlib.pyplot as plt

#create basic scatterplot
plt.plot(x, y, 'o')

#obtain m (slope) and b(intercept) of linear regression line
m, b = np.polyfit(x, y, 1)

#add linear regression line to scatterplot 
plt.plot(x, m*x+b) 

Streudiagramm mit Regressionslinie in Python

Sie können die Farben des Diagramms nach Ihren Wünschen ändern. So ändern Sie beispielsweise die einzelnen Punkte in Grün und die Linie in Rot:

 #use green as color for individual points
plt.plot(x, y, 'o', color=' green ')

#obtain m (slope) and b(intercept) of linear regression line
m, b = np.polyfit(x, y, 1)

#use red as color for regression line
plt.plot(x, m*x+b, color=' red ') 

Streudiagramm mit Regressionslinie in Numpy

Methode 2: Verwenden Sie Seaborn

Sie können auch die Funktion regplot() der Seaborn-Visualisierungsbibliothek verwenden, um ein Streudiagramm mit einer Regressionslinie zu erstellen:

 import seaborn as sns

#create scatterplot with regression line
sns.regplot(x, y, ci=None) 

Streudiagramm mit Regressionslinie in Seaborn Python

Beachten Sie, dass ci=None Seaborn anweist, die Konfidenzintervallbänder im Diagramm auszublenden. Sie können sie jedoch auf Wunsch auch anzeigen lassen:

 import seaborn as sns

#create scatterplot with regression line and confidence interval lines
sns.regplot(x,y) 

Die vollständige Dokumentation zur Funktion regplot() finden Sie hier .

Zusätzliche Ressourcen

So führen Sie eine einfache lineare Regression in Python durch
So erstellen Sie ein Restdiagramm in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert