In der Statistik sagt uns ein Z-Score , wie viele Standardabweichungen ein bestimmter Wert vom Mittelwert der Grundgesamtheit hat. Wir verwenden die folgende Formel, um einen Z-Score für einen bestimmten Wert zu berechnen: z = (x – μ) / σ Gold:...
In der Statistik sagt uns ein Z-Score , wie viele Standardabweichungen ein bestimmter Wert vom Mittelwert der Grundgesamtheit hat. Wir verwenden die folgende Formel, um einen Z-Score für einen bestimmten Wert zu berechnen: z = (x – μ) / σ Gold:...
Ein Fehler, der in R auftreten kann, ist: Error: Discrete value supplied to continuous scale Dieser Fehler tritt auf, wenn Sie versuchen, eine kontinuierliche Skalierung auf eine Achse in ggplot2 anzuwenden, wenn die Variable auf dieser Achse nicht numerisch ist. In...
Sie können die folgende grundlegende Syntax verwenden, um die Standardabweichung von Spalten in R zu berechnen: #calculate standard deviation of one column sd(df$col1) #calculate standard deviation of all columns sapply(df, sd) #calculate standard deviation of specific columns sapply(df[c(' col1 ', '...
Die Funktion colMeans() in R kann verwendet werden, um den Durchschnitt mehrerer Spalten einer Matrix oder eines Datenrahmens in R zu berechnen. Diese Funktion verwendet die folgende grundlegende Syntax: #calculate column means of every column colMeans(df) #calculate column means and exclude...
Ein Vorzeichentest ist ein nichtparametrischer Test, mit dem ermittelt wird, ob eine Grundgesamtheit dem Medianwert eines bestimmten Werts entspricht. Das folgende Schritt-für-Schritt-Beispiel zeigt, wie Sie einen Vorzeichentest in Excel durchführen. Schritt 1: Geben Sie die Daten ein Angenommen, eine Produktionsanlage gibt...
In der Statistik stellen kategoriale Daten Daten dar, die Namen oder Bezeichnungen annehmen können. Beispiele beinhalten: Raucherstatus („Raucher“, „Nichtraucher“) Augenfarbe („blau“, „grün“, „hasel“) Bildungsniveau (z. B. „Abitur“, „Bachelor“, „Master“) Drei häufig verwendete Diagramme zur Visualisierung dieser Art von Daten sind: Balkendiagramm...
Sie können die folgende grundlegende Syntax verwenden, um Variablen in dplyr zu gruppieren: df %>% arrange (group_var, numeric_var) %>% group_by (group_var) %>% mutate (rank = rank(numeric_var)) Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis mit dem folgenden Datenrahmen verwendet...
Sie können die folgende grundlegende Syntax verwenden, um Spalten basierend auf der Bedingung in R zu summieren: #sum values in column 3 where col1 is equal to 'A' sum(df[ which (df$col1==' A '), 3]) Die folgenden Beispiele zeigen, wie diese Syntax...
In der Statistik wird die Gammaverteilung häufig zur Modellierung von Wahrscheinlichkeiten im Zusammenhang mit Wartezeiten verwendet. Wir können die folgenden Funktionen verwenden, um mit der Gammaverteilung in R zu arbeiten: dgamma(x, Form, Rate) – ermittelt den Wert der Dichtefunktion einer Gammaverteilung...