Häufig möchten Sie möglicherweise mehrere Spalten eines Pandas-DataFrames gruppieren und aggregieren. Glücklicherweise ist dies mit den Pandas-Funktionen .groupby() und .agg() einfach zu bewerkstelligen. In diesem Tutorial werden einige Beispiele für den praktischen Einsatz dieser Funktionen erläutert. Beispiel 1: Gruppieren Sie nach...
Häufig möchten Sie möglicherweise die Datenwerte einer oder mehrerer Spalten in einem Pandas-DataFrame normalisieren . In diesem Tutorial werden zwei Möglichkeiten erläutert, dies zu tun: 1. Min-Max-Normalisierung Zweck: Konvertiert jeden Datenwert in einen Wert zwischen 0 und 1. Formel: Neuer Wert...
Der Shapiro-Wilk-Test ist ein Normalitätstest. Es wird verwendet, um zu bestimmen, ob eine Stichprobe aus einerNormalverteilung stammt oder nicht. Um einen Shapiro-Wilk-Test in Python durchzuführen, können wir die Funktion scipy.stats.shapiro() verwenden, die die folgende Syntax verwendet: scipy.stats.shapiro(x) Gold: x: eine Tabelle...
Mit dem Kolmogorov-Smirnov-Test wird getestet, ob eine Stichprobe aus einer bestimmten Verteilung stammt oder nicht. Um einen Kolmogorov-Smirnov-Test in Python durchzuführen, können wir scipy.stats.kstest() für einen Test mit einer Stichprobe oder scipy.stats.ks_2samp() für einen Test mit zwei Stichproben verwenden. Dieses Tutorial...
Forscher entnehmen häufig Stichproben aus einer Population und nutzen die Daten aus der Stichprobe, um Rückschlüsse auf die Population als Ganzes zu ziehen. Eine häufig verwendete Stichprobenmethode ist die geschichtete Zufallsstichprobe , bei der eine Population in Gruppen aufgeteilt wird und...
Häufig möchten Sie möglicherweise die Farbe von Punkten in einem Matplotlib-Streudiagramm basierend auf einer dritten Variablen schattieren. Glücklicherweise ist dies mit der Funktion matplotlib.pyplot.scatter() einfach zu bewerkstelligen, die die folgende Syntax verwendet: matplotlib.pyplot.scatter(x, y, s=Keine, c=Keine, cmap=Keine) Gold: x: Wertetabelle, die...
Der Root Mean Square Error (RMSE) ist eine Metrik, die uns sagt, wie weit unsere vorhergesagten Werte im Durchschnitt von unseren beobachteten Werten in einem Modell entfernt sind. Es wird wie folgt berechnet: RMSE = √[ Σ(P i – O i...
Häufig möchten Sie möglicherweise die Schriftgröße verschiedener Elemente in einem Matplotlib-Plot ändern. Glücklicherweise ist dies mit dem folgenden Code einfach zu bewerkstelligen: import matplotlib.pyplot as plt plt. rc ('font', size=10) #controls default text size plt. rc ('axes', titlesize=10) #fontsize of the...
Ein Konturdiagramm ist eine Art Diagramm, mit dem wir dreidimensionale Daten mithilfe von Konturen in zwei Dimensionen visualisieren können. Sie können in Matplotlib ein Konturdiagramm mit den folgenden zwei Funktionen erstellen: matplotlib.pyplot.contour() – Erstellt Konturdiagramme. matplotlib.pyplot.contourf() – Erstellt gefüllte Konturdiagramme. Die...
Häufig möchten Sie möglicherweise Teilstriche von einer oder mehreren Achsen in einem Matplotlib-Diagramm entfernen. Glücklicherweise ist dies mit der Funktion tick_params() einfach zu bewerkstelligen. Dieses Tutorial zeigt anhand des folgenden Streudiagramms mehrere Beispiele für die praktische Verwendung dieser Funktion: import matplotlib.pyplot...