So führen sie eine quadratische regression in excel durch
Regression ist eine statistische Technik, mit der wir die Beziehung zwischen einer oder mehreren Prädiktorvariablen und einer Antwortvariablen erklären können. Der häufigste Regressionstyp ist die lineare Regression , die wir verwenden, wenn die Beziehung zwischen der Prädiktorvariablen und der Antwortvariablen linear ist.
Mit anderen Worten: Wenn die Prädiktorvariable zunimmt, nimmt tendenziell auch die Antwortvariable zu. Beispielsweise können wir ein lineares Regressionsmodell verwenden, um den Zusammenhang zwischen der Anzahl der gelernten Stunden (Prädiktorvariable) und der Note, die ein Schüler bei einer Prüfung erhält (Antwortvariable), zu beschreiben.
Manchmal ist die Beziehung zwischen einer Prädiktorvariablen und einer Antwortvariablen jedoch nichtlinear . Eine häufige Art nichtlinearer Beziehung ist die quadratische Beziehung , die in einem Diagramm wie ein U oder ein auf dem Kopf stehendes U aussehen kann.
Das heißt, wenn die Prädiktorvariable zunimmt, nimmt tendenziell auch die Antwortvariable zu, aber ab einem bestimmten Punkt beginnt die Antwortvariable abzunehmen, wenn die Prädiktorvariable weiter zunimmt.
Beispielsweise können wir ein quadratisches Regressionsmodell verwenden, um die Beziehung zwischen der Anzahl der Arbeitsstunden und dem gemeldeten Glücksgrad einer Person zu beschreiben. Je mehr ein Mensch arbeitet, desto erfüllter fühlt er sich vielleicht, aber sobald er eine bestimmte Schwelle erreicht, führt mehr Arbeit tatsächlich zu Stress und verminderter Zufriedenheit. In diesem Fall würde ein quadratisches Regressionsmodell besser zu den Daten passen als ein lineares Regressionsmodell.
Sehen wir uns ein Beispiel für die Durchführung einer quadratischen Regression in Excel an.
Quadratische Regression in Excel
Angenommen, wir haben Daten über die Anzahl der pro Woche geleisteten Arbeitsstunden und den gemeldeten Grad der Zufriedenheit (auf einer Skala von 0 bis 100) für 16 verschiedene Personen:
Erstellen wir zunächst ein Streudiagramm, um zu sehen, ob die lineare Regression ein geeignetes Modell für die Datenanpassung ist.
Markieren Sie die Zellen A2:B17 . Klicken Sie anschließend im oberen Menüband auf die Registerkarte EINFÜGEN und dann im Bereich Diagramme auf Streuung . Dadurch wird ein Streudiagramm der Daten erstellt:
Es ist leicht zu erkennen, dass der Zusammenhang zwischen geleisteten Arbeitsstunden und der gemeldeten Zufriedenheit nicht linear ist . Tatsächlich folgt es einer „U“-Form, was es zu einem perfekten Kandidaten für die quadratische Regression macht.
Bevor wir das quadratische Regressionsmodell an die Daten anpassen, müssen wir eine neue Spalte für die quadrierten Werte unserer Prädiktorvariablen erstellen.
Markieren Sie zunächst alle Werte in Spalte B und ziehen Sie sie in Spalte C.
Geben Sie als Nächstes die Formel =A2^2 in Zelle B2 ein. Dies ergibt den Wert 36 . Klicken Sie anschließend auf die rechte untere Ecke von Zelle B2 und ziehen Sie die Formel nach unten, um die verbleibenden Zellen in Spalte B zu füllen.
Als nächstes passen wir das quadratische Regressionsmodell an.
Klicken Sie im oberen Menüband auf DATEN und dann ganz rechts auf die Option Datenanalyse . Wenn diese Option nicht angezeigt wird, müssen Sie zunächst die kostenlose Analysis ToolPak-Software installieren .
Sobald Sie auf Datenanalyse klicken, wird ein Feld angezeigt. Klicken Sie auf Regression und dann auf OK .
Geben Sie als Nächstes die folgenden Werte in das angezeigte Regressionsfeld ein. Klicken Sie dann auf OK .
Folgende Ergebnisse werden angezeigt:
So interpretieren Sie die verschiedenen Zahlen in der Ausgabe:
R-Quadrat: Auch Bestimmtheitsmaß genannt. Dabei handelt es sich um den Anteil der Varianz in der Antwortvariablen, der durch die Prädiktorvariablen erklärt werden kann. In diesem Beispiel beträgt das R-Quadrat 0,9092 , was darauf hinweist, dass 90,92 % der Varianz im gemeldeten Glücksniveau durch die Anzahl der geleisteten Arbeitsstunden und die Anzahl der geleisteten Arbeitsstunden erklärt werden können ^2.
Standardfehler: Der Standardfehler der Regression ist der durchschnittliche Abstand zwischen den beobachteten Werten und der Regressionsgeraden. In diesem Beispiel weichen die beobachteten Werte im Durchschnitt um 9.519 Einheiten von der Regressionsgeraden ab.
F-Statistik : Die F-Statistik wird als Regressions-MS/Rest-MS berechnet. Diese Statistik gibt an, ob das Regressionsmodell eine bessere Anpassung an die Daten bietet als ein Modell, das keine unabhängigen Variablen enthält. Im Wesentlichen wird getestet, ob das Regressionsmodell als Ganzes nützlich ist. Wenn keine der Prädiktorvariablen im Modell statistisch signifikant ist, ist die Gesamt-F-Statistik im Allgemeinen auch nicht statistisch signifikant. In diesem Beispiel beträgt die F-Statistik 65,09 und der entsprechende p-Wert ist <0,0001. Da dieser p-Wert kleiner als 0,05 ist, ist das Regressionsmodell insgesamt signifikant.
Regressionskoeffizienten: Die Regressionskoeffizienten in der letzten Tabelle geben uns die Zahlen an, die wir zum Schreiben der geschätzten Regressionsgleichung benötigen:
y hat = b 0 + b 1 x 1 + b 2 x 1 2
In diesem Beispiel lautet die geschätzte Regressionsgleichung:
erklärtes Glücksniveau = -30,252 + 7,173 (geleistete Arbeitsstunden) -0,106 (geleistete Arbeitsstunden) 2
Mit dieser Gleichung können wir das erwartete Glücksniveau einer Person basierend auf den geleisteten Arbeitsstunden berechnen. Das erwartete Glücksniveau einer Person, die 30 Stunden pro Woche arbeitet, beträgt beispielsweise:
gemeldeter Glücksgrad = -30,252 + 7,173(30) -0,106(30) 2 = 88,649 .
Zusätzliche Ressourcen
So fügen Sie in Excel eine quadratische Trendlinie hinzu
So lesen und interpretieren Sie eine Regressionstabelle
Was ist ein guter R-Quadrat-Wert?
Den Standardfehler der Regression verstehen
Eine einfache Anleitung zum Verständnis des F-Tests der Gesamtsignifikanz in der Regression