Eine der am häufigsten verwendeten Metriken zur Messung der Prognosegenauigkeit eines Modells ist MAPE , was für den mittleren absoluten prozentualen Fehler steht. Die Formel zur Berechnung des MAPE lautet wie folgt: MAPE = (1/n) * Σ(|tatsächlich – Prognose| / |tatsächlich|)...
Ein Kreisdiagramm ist ein kreisförmiges Diagramm, das „Kreis“ verwendet, um die relative Größe von Daten anzuzeigen. In diesem Tutorial wird erklärt, wie Sie Kreisdiagramme in Stata erstellen und bearbeiten. So erstellen Sie Kreisdiagramme in Stata Wir verwenden einen Datensatz namens „census“...
Ein QQ-Diagramm , kurz für „Quantil-Quantil“, wird häufig verwendet, um zu bewerten, ob die Residuen einer Regressionsanalyse normalverteilt sind oder nicht. In diesem Tutorial wird erläutert, wie Sie ein QQ-Diagramm in Stata erstellen und interpretieren. Beispiel: QQ-Diagramm in Stata Für dieses...
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist. Um zu bewerten, wie gut ein logistisches Regressionsmodell zu einem Datensatz passt, können wir uns die folgenden zwei Metriken ansehen: Sensitivität: Die...
Eine einfaktorielle ANOVA wird verwendet, um zu bestimmen, ob unterschiedliche Niveaus einer erklärenden Variablen zu statistisch unterschiedlichen Ergebnissen bei bestimmten Antwortvariablen führen. Beispielsweise könnte es uns interessieren, ob drei Bildungsniveaus (Associate-Abschluss, Bachelor-Abschluss, Master-Abschluss) zu statistisch unterschiedlichen Jahresverdiensten führen. In diesem Fall...
Die lineare Regression ist eine Methode, mit der wir die Beziehung zwischen einer oder mehreren erklärenden Variablen und einer Antwortvariablen verstehen können. Wenn wir eine lineare Regression durchführen, möchten wir normalerweise den Durchschnittswert der Antwortvariablen basierend auf dem Wert der erklärenden...
Viele statistische Tests erfordern, dass eine oder mehrere Variablen normalverteilt sind, damit die Testergebnisse zuverlässig sind. In diesem Tutorial werden verschiedene Methoden erläutert, mit denen Sie die Normalität zwischen Variablen in Stata testen können. Für jede dieser Methoden verwenden wir den...
Multikollinearität in der Regressionsanalyse tritt auf, wenn zwei oder mehr erklärende Variablen stark miteinander korrelieren, sodass sie im Regressionsmodell keine eindeutigen oder unabhängigen Informationen liefern. Wenn der Korrelationsgrad zwischen den Variablen hoch genug ist, kann dies zu Problemen bei der Anpassung...
Ein Mann-Whitney-U-Test (manchmal auch Wilcoxon-Rangsummentest genannt) wird verwendet, um Unterschiede zwischen zwei Stichproben zu vergleichen, wenn die Stichprobenverteilungen nicht normalverteilt sind und die Stichprobengrößen klein sind (n < 30). Er gilt als nichtparametrisches Äquivalent des t-Tests bei zwei Stichproben . In...
Multikollinearität in der Regressionsanalyse tritt auf, wenn zwei oder mehr erklärende Variablen stark miteinander korrelieren, sodass sie im Regressionsmodell keine eindeutigen oder unabhängigen Informationen liefern. Wenn der Korrelationsgrad zwischen den Variablen hoch genug ist, kann dies zu Problemen bei der Anpassung...