Der Bereich Statistik beschäftigt sich mit der Erhebung, Analyse, Interpretation und Darstellung von Daten. Im Bereich des Rechnungswesens sind Statistiken aus folgenden Gründen wichtig: Grund 1 : Buchhalter verwenden deskriptive Statistiken, um Daten zu Unternehmenseinnahmen, -ausgaben und -gewinnen zusammenzufassen. Grund 2...
Der Perzentilrang eines Werts gibt uns den Prozentsatz der Werte in einem Datensatz an, deren Rang gleich oder niedriger als ein bestimmter Wert ist. Sie können die folgenden Methoden verwenden, um den Perzentilrang bei Pandas zu berechnen: Methode 1: Berechnen Sie...
Sie können die Funktion „beschreiben()“ verwenden, um beschreibende Statistiken für Variablen in einem Pandas-DataFrame zu generieren. Sie können die folgende grundlegende Syntax verwenden, um die Funktion „beschreiben()“ mit der Funktion „groupby()“ in Pandas zu verwenden: df. groupby (' group_var ')[' values_var...
Mit dem xarray- Modul können Sie schnell einen 3D-Pandas-DataFrame erstellen. In diesem Tutorial wird erklärt, wie Sie mit den Funktionen des xarray-Moduls den folgenden Pandas 3D DataFrame erstellen: product_A product_B product_C year quarter 2021 Q1 1.624345 0.319039 50 Q2 -0.611756 0.319039...
Der einfachste Weg, die Wahrscheinlichkeit aus einem Z-Score zu ermitteln, besteht darin, einfach die Wahrscheinlichkeit zu ermitteln, die dem Z-Score in der Z-Tabelle entspricht. In diesem Tutorial wird erklärt, wie Sie mithilfe der Z-Tabelle die folgenden Wahrscheinlichkeiten ermitteln: Die Wahrscheinlichkeit, dass...
Der Mittelwert stellt den Durchschnittswert in einem Datensatz dar. Es wird wie folgt berechnet: Stichprobenmittelwert = Σx i / n Gold: Σ: Ein Symbol, das „Summe“ bedeutet x i : Die i- te Beobachtung in einem Datensatz n: die Gesamtzahl der...
Einer der gebräuchlichsten Clustering-Algorithmen beim maschinellen Lernen ist das sogenannte K-Means-Clustering . K-Means-Clustering ist eine Technik, bei der wir jede Beobachtung aus einem Datensatz in einem von K Clustern platzieren. Das Endziel besteht darin, K- Cluster zu haben, in denen die...
Sie können die folgenden Methoden verwenden, um LIKE (ähnlich wie SQL) in einer pandas query() -Funktion zu verwenden, um Zeilen zu finden, die ein bestimmtes Muster enthalten: Methode 1: Suchen Sie nach Zeilen, die ein Muster enthalten df. query (' my_column.str.contains("pattern1")...
Sie können die folgenden Methoden verwenden, um eine Verteilung von Spaltenwerten in einem Pandas-DataFrame darzustellen: Methode 1: Zeichnen Sie die Werteverteilung in einer Spalte grafisch auf df[' my_column ']. plot (kind=' kde ') Methode 2: Zeichnen Sie die Verteilung der Werte...