Ein Balkendiagramm eignet sich zur Visualisierung der Mengen verschiedener kategorialer Variablen. Manchmal möchten wir ein Balkendiagramm erstellen, das die Mengen kategorialer Variablen, unterteilt in Untergruppen, visualisiert. Beispielsweise möchten wir möglicherweise die Gesamtverkäufe von Popcorn und Limonade für drei verschiedene Sportstadien visualisieren....
In der Statistik sagt uns ein Z-Score , wie viele Standardabweichungen ein bestimmter Wert vom Mittelwert hat. Wir verwenden die folgende Formel, um einen Z-Score zu berechnen: z = (X – μ) / σ Gold: X ist ein einzelner Rohdatenwert μ...
In der Statistik ist der mittlere absolute Fehler (MAE) eine Möglichkeit, die Genauigkeit eines bestimmten Modells zu messen. Es wird wie folgt berechnet: MAE = (1/n) * Σ|y i – x i | Gold: Σ: Ein griechisches Symbol mit der Bedeutung...
In der Statistik bezeichnet ein Bevölkerungsanteil den Anteil der Individuen in einer Bevölkerung mit einem bestimmten Merkmal. Angenommen, 43,8 % der Einwohner einer bestimmten Stadt unterstützen ein neues Gesetz. Der Wert 0,438 stellt einen Bevölkerungsanteil dar. Formel für einen Bevölkerungsanteil Ein...
In einer Häufigkeitsverteilung sind Klassengrenzen die Werte, die Klassen trennen. Wir verwenden die folgenden Schritte, um Klassengrenzen in einer Häufigkeitsverteilung zu berechnen: 1. Subtrahieren Sie die Obergrenze der ersten Klasse von der Untergrenze der zweiten Klasse. 2. Teilen Sie das Ergebnis...
Ein Histogramm ist ein Diagramm, das uns hilft, die Verteilung von Werten in einem Datensatz zu visualisieren. Es stellt sich heraus, dass die Anzahl der in einem Histogramm verwendeten Kästchen einen großen Einfluss darauf haben kann, wie wir Daten interpretieren. Wenn...
Schiefe ist eine Möglichkeit, die Symmetrie einer Verteilung zu beschreiben. Eine Verteilung ist schief , wenn sie auf der linken Seite der Verteilung einen „Schwanz“ hat: Eine Verteilung ist rechtsschief , wenn sie auf der rechten Seite der Verteilung einen „Schwanz“...
Die Funktion pandas fillna() ist nützlich, um fehlende Werte in den Spalten eines pandas DataFrame zu füllen. Dieses Tutorial bietet mehrere Beispiele für die Verwendung dieser Funktion zum Ausfüllen fehlender Werte für mehrere Spalten im folgenden Pandas-DataFrame: import pandas as pd...
Mithilfe eines Mann-Kendall-Trendtests wird ermittelt, ob in Zeitreihendaten ein Trend vorliegt oder nicht. Hierbei handelt es sich um einen nichtparametrischen Test, d. h. es werden keine zugrunde liegenden Annahmen über die Normalität der Daten getroffen. Die Testhypothesen lauten wie folgt: H...
Eine Heatmap ist eine Art Diagramm, das verschiedene Farbschattierungen zur Darstellung von Datenwerten verwendet. In diesem Tutorial wird erläutert, wie Sie Heatmaps mithilfe der Seaborn Python-Visualisierungsbibliothek mit dem folgenden Datensatz erstellen: #import seaborn import seaborn as sns #load "flights" dataset data...