Ein F-Test wird verwendet, um zu testen, ob zwei Populationsvarianzen gleich sind. Die Null- und Alternativhypothese des Tests lauten wie folgt: H 0 : σ 1 2 = σ 2 2 (Populationsvarianzen sind gleich) H 1 : σ 1 2 ≠...
Die logistische Regression ist eine Methode, mit der wir ein Regressionsmodell anpassen können, wenn die Antwortvariable binär ist. Bevor ein Modell an einen Datensatz angepasst wird, geht die logistische Regression von den folgenden Annahmen aus: Annahme Nr. 1: Die Antwortvariable ist...
Bei vielen statistischen Tests wird davon ausgegangen, dass die Residuen einer Antwortvariablen normalverteilt sind. Allerdings sind die Residuen oft nicht normalverteilt. Eine Möglichkeit, dieses Problem zu lösen, besteht darin, die Antwortvariable mithilfe einer von drei Transformationen zu transformieren: 1. Log-Transformation: Transformieren...
Eine Box-Cox-Transformation ist eine häufig verwendete Methode zur Transformation eines nicht normalverteilten Datensatzes in einennormalverteilteren Satz. Die Grundidee dieser Methode besteht darin, mithilfe der folgenden Formel einen Wert für λ zu finden, sodass die transformierten Daten möglichst nahe an der Normalverteilung...
Eine ANOVA mit wiederholten Messungen wird verwendet, um zu bestimmen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen besteht, in denen in jeder Gruppe dieselben Probanden vorkommen. In diesem Tutorial wird erläutert, wie eine einfaktorielle ANOVA...
Es gibt zwei einfache Möglichkeiten, den Legendentitel in einem ggplot2-Diagramm zu ändern: Methode 1: Verwenden Sie labs() ggplot(data, aes(x=x_var, y=y_var, fill=fill_var)) + geom_boxplot() + labs(fill=' Legend Title ') Methode 2: Scale_fill_manual() verwenden ggplot(data, aes(x=x_var, y=y_var, fill=fill_var)) + geom_boxplot() + scale_fill_manual(' Legend...
Sie können die R-Visualisierungsbibliothek ggplot2 verwenden, um ein angepasstes lineares Regressionsmodell mit der folgenden grundlegenden Syntax zu zeichnen: ggplot(data,aes(x, y)) + geom_point() + geom_smooth(method=' lm ') Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird. Beispiel: Zeichnen einer...
Sie können die R-Basisfunktion cumsum() verwenden, um die kumulative Summe eines Vektors numerischer Werte einfach zu berechnen. In diesem Tutorial wird erläutert, wie Sie mit dieser Funktion die kumulative Summe eines Vektors berechnen und wie Sie eine kumulative Summe visualisieren. So...
Gegeben sei der Vektor a = [a 1 , a 2 , a 3 ] und der Vektor b = [b 1 , b 2 , b 3 ], das Skalarprodukt des Vektors a und des Vektors b, bezeichnet mit ab...
Häufig möchten Sie möglicherweise die erste Zeile jeder Gruppe mithilfe des dplyr- Pakets in R auswählen. Dazu können Sie die folgende grundlegende Syntax verwenden: df %>% group_by (group_var) %>% arrange (values_var) %>% filter (row_number()== 1 ) Das folgende Beispiel zeigt, wie...