Eine der wichtigsten Annahmen der linearen Regression besteht darin, dass die Residuen auf jeder Ebene der Prädiktorvariablen mit gleicher Varianz verteilt sind. Diese Annahme wird als Homoskedastizität bezeichnet. Wenn diese Annahme nicht berücksichtigt wird, spricht man von Heteroskedastizität in den Residuen....
Ein Stanine-Score , kurz für „Standard Score Nine“, ist eine Methode zur Skalierung von Testergebnissen auf einer Standard-Neun-Punkte-Skala. Mit dieser Methode können wir jedes Testergebnis vom ursprünglichen Ergebnis (d. h. 0 bis 100) in eine Zahl zwischen 1 und 9 umwandeln....
In der Statistik sind Dezile Zahlen, die einen Datensatz in zehn Gruppen gleicher Häufigkeit unterteilen. Das erste Dezil ist der Punkt, den 10 % aller Datenwerte unterschreiten. Das zweite Dezil ist der Punkt, an dem 20 % aller Datenwerte unterschritten werden,...
Ein Residuum ist die Differenz zwischen einem beobachteten Wert und einem vorhergesagten Wert in einem Regressionsmodell. Es wird wie folgt berechnet: Residuum = Beobachteter Wert – Vorhergesagter Wert Eine Möglichkeit zu verstehen, wie gut ein Regressionsmodell zu einem Datensatz passt, ist...
Ein Residuum ist die Differenz zwischen einem beobachteten Wert und einem vorhergesagten Wert in einem Regressionsmodell. Es wird wie folgt berechnet: Residuum = Beobachteter Wert – Vorhergesagter Wert Eine Möglichkeit zu verstehen, wie gut ein Regressionsmodell zu einem Datensatz passt, ist...
Eine der Hauptannahmen der linearen Regression ist, dass die Residuen normalverteilt sind. Eine Möglichkeit, diese Annahme visuell zu überprüfen, besteht darin, ein Histogramm der Residuen zu erstellen und zu beobachten, ob die Verteilung einer „Glockenform“ folgt, die an die Normalverteilung erinnert....
Ein Ausreißer ist eine Beobachtung , die ungewöhnlich weit von anderen Werten in einem Datensatz entfernt ist. Ausreißer können problematisch sein, da sie die Ergebnisse einer Analyse beeinflussen können. Eine gängige Methode zum Erkennen von Ausreißern in einem Datensatz ist die...
In der Statistik sind wir häufig an der Messung von Populationsparametern interessiert, also Zahlen, die bestimmte Merkmale einer gesamten Population beschreiben. Zwei der häufigsten Populationsparameter sind: 1. Bevölkerungsmittelwert: der Durchschnittswert einer Variablen in einer Bevölkerung (z. B. die durchschnittliche Körpergröße von...
Ein Boxplot ist eine Art Diagramm, das die fünfstellige Zusammenfassung eines Datensatzes anzeigt, der Folgendes umfasst: Der Mindestwert Das erste Quartil (das 25. Perzentil) Der Medianwert Das dritte Quartil (das 75. Perzentil) Der Maximalwert Um ein Boxplot zu erstellen, zeichnen wir...
Bei zwei Ereignissen, A und B, bedeutet „Ermitteln der Wahrscheinlichkeit von A und B“ das Ermitteln der Wahrscheinlichkeit, dass Ereignis A und Ereignis B beide eintreten . Wir schreiben diese Wahrscheinlichkeit im Allgemeinen auf zwei Arten: P(A und B) – Schriftliche...