Boxplots eignen sich zur Visualisierung der fünfstelligen Zusammenfassung eines Datensatzes, der Folgendes umfasst: Minimum Das erste Quartil Der Median Das dritte Quartil Das Maximum Verwandte Themen: Eine sanfte Einführung in Boxplots Glücklicherweise ist es mit der Visualisierungsbibliothek ggplot2 einfach, Boxplots in...
Standardmäßig ordnet ggplot2 die Balken in einem Balkendiagramm in der folgenden Reihenfolge an: Faktorvariablen werden nach Faktorstufen klassifiziert. Zeichenvariablen werden alphabetisch aufgelistet. Möglicherweise sind Sie jedoch häufig daran interessiert, die Riegel in einer anderen, bestimmten Reihenfolge zu bestellen. In diesem Tutorial...
Forscher entnehmen häufig Stichproben aus einer Population und nutzen die Daten aus der Stichprobe, um Rückschlüsse auf die Population als Ganzes zu ziehen. Eine häufig verwendete Stichprobenmethode ist die geschichtete Zufallsstichprobe , bei der eine Population in Gruppen aufgeteilt wird und...
Forscher entnehmen häufig Stichproben aus einer Population und nutzen die Daten aus der Stichprobe, um Rückschlüsse auf die Population als Ganzes zu ziehen. Eine häufig verwendete Stichprobenmethode ist die Cluster-Stichprobe , bei der eine Population in Cluster unterteilt wird und alle...
Forscher entnehmen häufig Stichproben aus einer Population und nutzen die Daten aus der Stichprobe, um Rückschlüsse auf die Population als Ganzes zu ziehen. Eine häufig verwendete Probenahmemethode ist die systematische Probenahme , die in einem einfachen zweistufigen Prozess umgesetzt wird: 1....
Bei der Zeitreihenanalyse ist ein gleitender Durchschnitt einfach der Durchschnittswert mehrerer früherer Perioden. Ein exponentieller gleitender Durchschnitt ist eine Art gleitender Durchschnitt, der den jüngsten Beobachtungen mehr Gewicht beimisst, was bedeutet, dass er in der Lage ist, aktuelle Trends schneller zu...
CSV-Dateien (durch Kommas getrennte Werte) sind eine der gebräuchlichsten Methoden zum Speichern von Daten. Glücklicherweise können Sie mit der Funktion pandas read_csv() ganz einfach CSV-Dateien in Python in fast jedem gewünschten Format lesen. In diesem Tutorial werden verschiedene Möglichkeiten zum Lesen...
Excel-Dateien sind eine der gebräuchlichsten Methoden zum Speichern von Daten. Glücklicherweise erleichtert die Pandas-Funktion read_excel() das Lesen von Excel-Dateien. In diesem Tutorial werden verschiedene Möglichkeiten zum Lesen von Excel-Dateien in Python mithilfe von Pandas erläutert. Beispiel 1: Eine Excel-Datei in einen...
Oft verfügen Sie über mehrere Pandas-DataFrames, die Sie in mehrere Excel-Tabellen innerhalb derselben Arbeitsmappe schreiben möchten. Glücklicherweise kann dies mit der Funktion pandas ExcelWriter() erfolgen. Um diese Funktion nutzen zu können, müssen Sie zunächst sicherstellen, dass xlsxwriter installiert ist: pip install...
Häufig möchten Sie möglicherweise mehrere Excel-Tabellen importieren und in einem einzigen Pandas-DataFrame kombinieren. Angenommen, Sie haben die folgende Excel-Arbeitsmappe namens data.xlsx mit drei verschiedenen Blättern, die alle zwei Spalten mit Basketballspielerdaten enthalten: Mit den Funktionen pandas concat() und read_excel() können wir...