Mit der folgenden benutzerdefinierten Funktion können Sie die Position zweier Spalten in einem Pandas-DataFrame vertauschen: def swap_columns (df, col1, col2): col_list = list ( df.columns ) x, y = col_list. index (col1), col_list. index (col2) col_list[y], col_list[x] = col_list[x], col_list[y] df...
Das R-Quadrat , oft als R2 geschrieben, ist der Anteil der Varianz in der Antwortvariablen , der durch die Prädiktorvariablen in einem linearen Regressionsmodell erklärt werden kann. Der Wert von R im Quadrat kann zwischen 0 und 1 variieren, wobei: 0...
Ein Fehler, der bei der Verwendung von Python auftreten kann, ist: TypeError : unsupported operand type(s) for -: 'str' and 'int' Dieser Fehler tritt auf, wenn Sie versuchen, eine Subtraktion mit einer Zeichenfolgenvariablen und einer numerischen Variablen durchzuführen. Das folgende Beispiel...
Wenn wir lineare Regressionsmodelle anpassen, berechnen wir häufig den R-Quadrat- Wert des Modells. Der R-Quadrat-Wert ist der Anteil der Varianz der Antwortvariablen , der durch die Prädiktorvariablen im Modell erklärt werden kann. Der Wert von R im Quadrat kann zwischen 0...
Ein Histogramm bietet eine nützliche Möglichkeit, die Verteilung von Werten in einem Datensatz zu visualisieren. Die x-Achse eines Histogramms zeigt Gruppen von Datenwerten an und die y-Achse sagt uns, wie viele Beobachtungen in einem Datensatz sich in jeder Gruppe befinden. Da...
Beim maschinellen Lernen ist die Fehlklassifizierungsrate eine Metrik, die uns den Prozentsatz der Beobachtungen angibt, die von einem Klassifizierungsmodell falsch vorhergesagt wurden. Es wird wie folgt berechnet: Fehlklassifizierungsrate = # falsche Vorhersagen / # Gesamtvorhersagen Der Wert der Fehlklassifizierungsrate kann zwischen...
Eine Testhypothese wird verwendet, um zu testen, ob eine Hypothese über einen Populationsparameter wahr ist oder nicht. Wenn wir einen Hypothesentest durchführen, definieren wir immer eine Null- und Alternativhypothese: Nullhypothese (H 0 ): Die Stichprobendaten stammen allein durch Zufall. Alternativhypothese (...
Eine der gebräuchlichsten Methoden zur Bewertung der Leistung eines Klassifizierungsmodells ist die Erstellung einer Verwirrungsmatrix, die die vorhergesagten Ergebnisse des Modells mit den tatsächlichen Ergebnissen des Datensatzes zusammenfasst. Zwei Metriken, die uns in einer Verwirrungsmatrix häufig interessieren, sind der positive Vorhersagewert...
Ein Fehler, der in R auftreten kann, ist: Error in .Call.graphics(C_palette2, .Call(C_palette2, NULL)): invalid graphics state Dieser Fehler kann aus drei Gründen auftreten: 1. Sie erstellen Diagramme in Basis-R und ggplot2 während derselben Sitzung. 2. Ihre Version von ggplot2 ist nicht...
Die Funktion readLines() in R kann verwendet werden, um alle oder einen Teil der Textzeilen aus einem Verbindungsobjekt zu lesen. Diese Funktion verwendet die folgende Syntax: readLines(con, n=-1L) Gold: Nachteil: ein Verbindungsobjekt oder eine Zeichenfolge n: Die maximale Anzahl der zu...