Logarithmische regression in python (schritt für schritt)


Bei der logarithmischen Regression handelt es sich um einen Regressionstyp, der zur Modellierung von Situationen verwendet wird, in denen sich Wachstum oder Rückgang zunächst schnell beschleunigen und sich dann mit der Zeit verlangsamen.

Die folgende Grafik zeigt beispielsweise ein Beispiel für einen logarithmischen Zerfall:

Für diese Art von Situation könnte die Beziehung zwischen einer Prädiktorvariablen und einer Antwortvariablen mithilfe einer logarithmischen Regression gut modelliert werden.

Die Gleichung für ein logarithmisches Regressionsmodell hat die folgende Form:

y = a + b*ln(x)

Gold:

  • y: die Antwortvariable
  • x: die Vorhersagevariable
  • a, b: die Regressionskoeffizienten, die die Beziehung zwischen x und y beschreiben

Das folgende Schritt-für-Schritt-Beispiel zeigt, wie man eine logarithmische Regression in Python durchführt.

Schritt 1: Erstellen Sie die Daten

Erstellen wir zunächst gefälschte Daten für zwei Variablen: x und y :

 import numpy as np
x = np. arange (1, 16, 1)
y = np. array ([59, 50, 44, 38, 33, 28, 23, 20, 17, 15, 13, 12, 11, 10, 9.5])

Schritt 2: Visualisieren Sie die Daten

Als Nächstes erstellen wir ein kurzes Streudiagramm, um die Beziehung zwischen x und y zu visualisieren:

 import matplotlib. pyplot as plt

plt. scatter (x,y)
plt. show () 

Aus der Grafik können wir ersehen, dass zwischen den beiden Variablen ein logarithmisches Abklingmuster besteht. Der Wert der Antwortvariablen y nimmt zunächst schnell ab und verlangsamt sich dann mit der Zeit.

Daher erscheint es sinnvoll, eine logarithmische Regressionsgleichung anzuwenden, um die Beziehung zwischen den Variablen zu beschreiben.

Schritt 3: Passen Sie das logarithmische Regressionsmodell an

Als nächstes verwenden wir die Funktion polyfit() , um ein logarithmisches Regressionsmodell anzupassen, wobei wir den natürlichen Logarithmus von x als Prädiktorvariable und y als Antwortvariable verwenden:

 #fit the model
fit = np. polyfit (np. log (x), y, 1)

#view the output of the model
print(fit)

[-20.19869943 63.06859979]

Wir können die Koeffizienten aus dem Ergebnis verwenden, um die folgende angepasste logarithmische Regressionsgleichung zu schreiben:

y = 63,0686 – 20,1987 * ln(x)

Wir können diese Gleichung verwenden, um die Antwortvariable y basierend auf dem Wert der Prädiktorvariablen x vorherzusagen. Wenn beispielsweise x = 12, würden wir vorhersagen, dass y 12,87 betragen würde:

y = 63,0686 – 20,1987 * ln(12) = 12,87

Bonus: Fühlen Sie sich frei, diesen Online-Rechner für die logarithmische Regression zu verwenden, um die logarithmische Regressionsgleichung für einen bestimmten Prädiktor und eine bestimmte Antwortvariable automatisch zu berechnen.

Zusätzliche Ressourcen

Eine vollständige Anleitung zur linearen Regression in Python
So führen Sie eine exponentielle Regression in Python durch
So führen Sie eine logistische Regression in Python durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert