In der Statistik beziehen sich Rohdaten auf Daten, die direkt aus einer Primärquelle erhoben und in keiner Weise verarbeitet wurden. Bei jeder Art von Datenanalyseprojekt besteht der erste Schritt darin, Rohdaten zu sammeln. Sobald diese Daten erfasst sind, können sie bereinigt,...
Korrelation wird verwendet, um den linearen Zusammenhang zwischen zwei Variablen zu messen. Ein Korrelationskoeffizient nimmt immer einen Wert zwischen -1 und 1 an, wobei: -1 zeigt eine vollkommen negative lineare Korrelation zwischen zwei Variablen an 0 bedeutet, dass zwischen zwei Variablen...
Ein Zeitreihendiagramm eignet sich zur Visualisierung von Datenwerten, die sich im Laufe der Zeit ändern. In diesem Tutorial wird erläutert, wie Sie mit dem Seaborn- Datenvisualisierungspaket in Python verschiedene Zeitreihendiagramme erstellen. Beispiel 1: Zeichnen Sie eine einzelne Zeitreihe Der folgende Code...
Sie können die folgende grundlegende Syntax verwenden, um ein Histogramm aus einem Pandas-DataFrame zu erstellen: df. hist (column=' col_name ') Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können. Beispiel 1: Zeichnen Sie ein einzelnes Histogramm Der...
Sie können die Funktion fillna() verwenden, um NaN-Werte in einem Pandas-DataFrame zu ersetzen. Diese Funktion verwendet die folgende grundlegende Syntax: #replace NaN values in one column df[' col1 '] = df[' col1 ']. fillna (0) #replace NaN values in multiple columns...
Sie können die folgende grundlegende Syntax verwenden, um zwei Pandas-DataFrames zu einem einzelnen DataFrame hinzuzufügen: big_df = pd. concat ([df1, df2], ignore_index= True ) Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können. Beispiel 1: Fügen Sie...
Sie können die folgende grundlegende Syntax verwenden, um einen Pandas-DataFrame basierend auf der Zeilennummer in mehrere DataFrames aufzuteilen: #split DataFrame into two DataFrames at row 6 df1 = df. iloc [:6] df2 = df. iloc [6:] Die folgenden Beispiele zeigen, wie...
Die Exponentialverteilung ist eine Wahrscheinlichkeitsverteilung, mit der die Zeit modelliert wird, die wir warten müssen, bis ein bestimmtes Ereignis eintritt. Wenn eine Zufallsvariable X einer Exponentialverteilung folgt, kann die kumulative Dichtefunktion von X geschrieben werden: F (x; λ) = 1 –...
Sie können die folgende grundlegende Syntax verwenden, um einen VLOOKUP (ähnlich wie Excel) in Pandas durchzuführen: p.d. merge (df1, df2, on = ' column_name ', how = ' left ') Das folgende Schritt-für-Schritt-Beispiel zeigt, wie Sie diese Syntax in der Praxis...
Eine Streudiagrammmatrix ist genau das, wonach es sich anhört: eine Streudiagrammmatrix. Diese Art von Matrix ist nützlich, da Sie damit die Beziehung zwischen mehreren Variablen in einem Datensatz gleichzeitig visualisieren können. Sie können die Funktion „scatter_matrix()“ verwenden, um eine Streumatrix aus...