Ein Datensatz kann in zwei verschiedenen Formaten geschrieben werden: Wide und Long . Ein breites Format enthält Werte, die sich in der ersten Spalte nicht wiederholen. Ein Langformat enthält Werte, die sich in der ersten Spalte wiederholen . Betrachten Sie beispielsweise...
In der Statistik beziehen sich Fälle einfach auf Personen in einem Datensatz. In den meisten Datensätzen haben wir Fälle (die Individuen) und Variablen (die Attribute der Individuen). Der folgende Datensatz enthält beispielsweise 10 Fälle und 3 Variablen, die wir für jeden...
Sie können das cmap- Argument in Matplotlib verwenden, um Graustufenbilder einfach anzuzeigen. Das folgende Beispiel zeigt, wie dieses Argument in der Praxis verwendet wird. Beispiel: Bild in Graustufen in Matplotlib anzeigen Nehmen wir an, ich habe das folgende Bild namens shape.JPG...
Mit dem Kolmogorov-Smirnov-Test wird ermittelt, ob eine Stichprobe normalverteilt ist oder nicht. Dieser Test wird häufig verwendet, da viele statistische Tests und Verfahren davon ausgehen , dass die Daten normalverteilt sind. Das folgende Schritt-für-Schritt-Beispiel zeigt, wie ein Kolmogorov-Smirnov-Test an einem Beispieldatensatz...
Die Funktion „scale()“ in R kann zum Skalieren von Werten in einem Vektor, einer Matrix oder einem Datenrahmen verwendet werden. Diese Funktion verwendet die folgende grundlegende Syntax: scale(x, center = TRUE , scale = TRUE ) Gold: x : Name des...
Ein Fehler, der in Python auftreten kann, ist: TypeError :Cannot perform 'rand_' with a dtyped [int64] array and scalar of type [bool] Dieser Fehler tritt normalerweise auf, wenn Sie versuchen, einen Pandas-DataFrame mithilfe mehrerer Bedingungen zu filtern, aber keine Klammern um...
Beim Zentrieren eines Datensatzes wird der Mittelwert jeder einzelnen Beobachtung im Datensatz subtrahiert. Sobald Sie einen Datensatz zentrieren, wird der Durchschnittswert des Datensatzes Null. Die folgenden Beispiele zeigen, wie man Daten in Python zentriert. Beispiel 1: Zentrieren Sie die Werte eines...
Die Spearman-Brown-Formel wird verwendet, um die Zuverlässigkeit eines Tests nach Änderung der Testdauer vorherzusagen. Die Formel lautet: Vorhergesagte Zuverlässigkeit = kr / (1 + (k-1)r) Gold: k : Faktor, um den die Testdauer verändert wird. Wenn der ursprüngliche Test beispielsweise 10...
Die Funktion split() in R kann verwendet werden, um Daten basierend auf Faktorstufen in Gruppen aufzuteilen. Diese Funktion verwendet die folgende grundlegende Syntax: teile(x, f, …) Gold: x : Name des Vektors oder Datenblocks, der in Gruppen unterteilt werden soll f...
Mit einem Wald-Test kann getestet werden, ob ein oder mehrere Parameter eines Modells bestimmten Werten entsprechen. Dieser Test wird häufig verwendet, um zu bestimmen, ob eine oder mehrere Prädiktorvariablen in einem Regressionsmodell gleich Null sind. Für diesen Test verwenden wir die...