Wenn wir eine einfache lineare Regression in R durchführen, ist es einfach, die angepasste Regressionslinie zu visualisieren, da wir nur mit einer einzigen Prädiktorvariablen und einer einzigen Antwortvariablen arbeiten. Der folgende Code zeigt beispielsweise, wie man ein einfaches lineares Regressionsmodell an...
Die Cook-Distanz wird verwendet, um einflussreiche Beobachtungen in einem Regressionsmodell zu identifizieren. Die Formel für die Cook-Distanz lautet: d i = (r i 2 / p*MSE) * (h ii / (1-h ii ) 2 ) Gold: r i ist der i...
Die kumulative Häufigkeit ist ein Maß für die Gesamthäufigkeit bis zu einem bestimmten Punkt in einer Liste von Datenwerten. Um die kumulative Häufigkeit einer Liste von Datenwerten zu berechnen, geben Sie einfach die durch Kommas getrennten Werte in das Feld unten...
Eine Häufigkeitstabelle ist eine Tabelle, die Informationen über Häufigkeiten anzeigt. Häufigkeiten sagen uns einfach, wie oft ein bestimmtes Ereignis aufgetreten ist. Die folgende Tabelle zeigt beispielsweise die Anzahl der Artikel, die ein Geschäft in verschiedenen Preisklassen in einer bestimmten Woche verkauft...
Eine einfaktorielle ANOVA wird verwendet, um zu bestimmen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen besteht. Wenn der Gesamt -p-Wert der ANOVA-Tabelle unter einem bestimmten Signifikanzniveau liegt, verfügen wir über ausreichende Beweise dafür, dass...
Eine der am häufigsten verwendeten Metriken zur Messung der Prognosegenauigkeit eines Modells ist MAPE , was für den mittleren absoluten prozentualen Fehler steht. Die Formel zur Berechnung des MAPE lautet wie folgt: MAPE = (1/n) * Σ(|tatsächlich – Prognose| / |tatsächlich|)...
Eine naive Prognose ist eine Prognose, bei der die Prognose für einen bestimmten Zeitraum einfach dem in der vorherigen Periode beobachteten Wert entspricht. Angenommen, wir haben in den ersten drei Monaten des Jahres die folgenden Verkäufe eines bestimmten Produkts: Die Umsatzprognose...
Ein Variationskoeffizient , oft mit CV abgekürzt, ist eine Möglichkeit, die Streuung von Werten in einem Datensatz relativ zum Mittelwert zu messen. Es wird wie folgt berechnet: CV = σ / μ Gold: σ: die Standardabweichung des Datensatzes μ: der Durchschnitt...
Ein Variationskoeffizient , oft mit CV abgekürzt, ist eine Möglichkeit, die Streuung von Werten in einem Datensatz relativ zum Mittelwert zu messen. Es wird wie folgt berechnet: CV = σ / μ Gold: σ: die Standardabweichung des Datensatzes μ: der Durchschnitt...
Eine Wahrscheinlichkeitsmassenfunktion , oft als PMF abgekürzt, gibt uns die Wahrscheinlichkeit an, mit der eine diskrete Zufallsvariable einen bestimmten Wert annimmt. Angenommen, wir würfeln einmal. Wenn wir x die Zahl bezeichnen, auf der der Würfel landet, dann lässt sich die Wahrscheinlichkeit,...