So berechnen sie rmse in sas
Eine Möglichkeit zu bewerten, wie gut ein Regressionsmodell zu einem Datensatz passt, besteht darin, den mittleren quadratischen Fehler zu berechnen, eine Metrik, die uns den durchschnittlichen Abstand zwischen den vorhergesagten Werten des Modells und den tatsächlichen Werten des Datensatzes angibt.
Je niedriger der RMSE, desto besser kann ein bestimmtes Modell einen Datensatz „anpassen“.
Die Formel zum Ermitteln des mittleren quadratischen Fehlers, oft als RMSE abgekürzt, lautet:
RMSE = √ Σ(P i – O i ) 2 / n
Gold:
- Σ ist ein Symbol, das „Summe“ darstellt
- P i ist der vorhergesagte Wert für die i-te Beobachtung im Datensatz
- O i ist der beobachtete Wert für die i-te Beobachtung im Datensatz
- n ist die Stichprobengröße
Das folgende Schritt-für-Schritt-Beispiel zeigt, wie der RMSE für ein einfaches lineares Regressionsmodell in SAS berechnet wird.
Schritt 1: Erstellen Sie die Daten
Für dieses Beispiel erstellen wir einen Datensatz, der die Gesamtzahl der gelernten Stunden und die Abschlussprüfungsnote von 15 Studenten enthält.
Wir werden ein einfaches lineares Regressionsmodell anpassen, das Stunden als Prädiktorvariable und den Score als Antwortvariable verwendet.
Der folgende Code zeigt, wie dieser Datensatz in SAS erstellt wird:
/*create dataset*/ data exam_data; input hours score; datalines ; 1 64 2 66 4 76 5 73 5 74 6 81 6 83 7 82 8 80 10 88 11 84 11 82 12 91 12 93 14 89 ; run ; /*view dataset*/ proc print data =exam_data;
Schritt 2: Passen Sie das einfache lineare Regressionsmodell an
Als nächstes verwenden wir proc reg, um das einfache lineare Regressionsmodell anzupassen:
/*fit simple linear regression model*/ proc reg data =exam_data; model score = hours; run ;
Beachten Sie, dass der RMSE in der Ausgabe 3,64093 beträgt.
Schritt 3: Extrahieren Sie den RMSE aus dem Regressionsmodell
Wenn Sie nur den RMSE dieses Modells und keines der anderen Ausgabeergebnisse anzeigen möchten, können Sie den folgenden Code verwenden:
/*fit simple linear regression model*/ proc reg data =exam_data outest =outest noprint ; model score = hours / rmse ; run ; quit ; /*print RMSE of model*/ proc print data =outest; var _RMSE_; run ;
Beachten Sie, dass in der Ausgabe nur der RMSE-Wert von 3,64093 angezeigt wird.
Hinweis : Das Argument noprint in proc reg weist SAS an, nicht wie im vorherigen Schritt die gesamte Ausgabe der Regressionsergebnisse zu drucken.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:
So führen Sie eine einfache lineare Regression in SAS durch
So führen Sie eine multiple lineare Regression in SAS durch
So führen Sie eine Polynomregression in SAS durch
So führen Sie eine logistische Regression in SAS durch