Sie können die Funktion DataFrame.std() verwenden, um die Standardabweichung von Werten in einem Pandas-DataFrame zu berechnen. Zur Berechnung der Standardabweichung können Sie in der Praxis folgende Methoden nutzen: Methode 1: Berechnen Sie die Standardabweichung einer Spalte df [ ' column_name '...
Die Faustregel , manchmal auch 68-95-99,7-Regel genannt, besagt, dass für einen gegebenen Datensatz mit einer Normalverteilung: 68 % der Datenwerte liegen innerhalb einer Standardabweichung vom Mittelwert. 95 % der Datenwerte liegen innerhalb von zwei Standardabweichungen vom Mittelwert. 99,7 % der Datenwerte...
Wir verwenden häufig den Pearson-Korrelationskoeffizienten , um die Korrelation zwischen kontinuierlichen numerischen Variablen zu berechnen. Wir müssen jedoch eine andere Metrik verwenden, um die Korrelation zwischen kategorialen Variablen zu berechnen, d. h. Variablen, die Namen oder Bezeichnungen annehmen, wie zum Beispiel:...
Mithilfe der One-Hot-Codierung werden kategoriale Variablen in ein Format konvertiert, das von Algorithmen für maschinelles Lernen problemlos verwendet werden kann. Die Grundidee des One-Hot-Codierens besteht darin, neue Variablen zu erstellen, die die Werte 0 und 1 annehmen, um die ursprünglichen kategorialen...
Sie können die folgende grundlegende Syntax verwenden, um Unterplots in der Seaborn- Datenvisualisierungsbibliothek in Python zu erstellen: #define dimensions of subplots (rows, columns) fig, axes = plt. subplots (2, 2) #create chart in each subplot sns. boxplot (data=df, x=' team ',...
Sie können die folgende grundlegende Syntax verwenden, um den Monat aus einem Datum in Pandas zu extrahieren: df[' month '] = pd. DatetimeIndex (df[' date_column ']). month Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können. Beispiel:...
Viele statistische Tests gehen davon aus, dass Datensätze normalverteilt sind. Dies ist jedoch in der Praxis häufig nicht der Fall. Eine Möglichkeit, dieses Problem zu lösen, besteht darin, die Werteverteilung in einem Datensatz mithilfe einer von drei Transformationen zu transformieren: 1....
One-Hot-Codierung wird verwendet, um kategoriale Variablen in ein Format zu konvertieren, das von Algorithmen für maschinelles Lernen verwendet werden kann. Die Grundidee des One-Hot-Codierens besteht darin, neue Variablen zu erstellen, die die Werte 0 und 1 annehmen, um die ursprünglichen kategorialen...
Mithilfe der polychorischen Korrelation wird die Korrelation zwischen Ordinalvariablen berechnet. Denken Sie daran, dass Ordinalvariablen Variablen sind, deren mögliche Werte kategorisch sind und eine natürliche Reihenfolge haben. Hier sind einige Beispiele für Variablen, die auf einer Ordinalskala gemessen werden: Zufriedenheit :...
Die logistische Regression ist eine Art Regressionsmodell, mit dem wir die Beziehung zwischen einer oder mehreren Prädiktorvariablen und einer Antwortvariablen verstehen können, wenn die Antwortvariable binär ist. Wenn wir nur eine Prädiktorvariable und eine Antwortvariable haben, können wir eine einfache logistische...