Das n-te Perzentil eines Datensatzes ist der Wert, der die obersten n Prozent der Datenwerte abschneidet, wenn alle Werte vom kleinsten zum größten sortiert werden. Beispielsweise ist das 90. Perzentil eines Datensatzes der Wert, der die unteren 90 % der Datenwerte...
Um die Leistung eines Modells anhand eines Datensatzes zu bewerten, müssen wir messen, wie gut die vom Modell gemachten Vorhersagen mit den beobachteten Daten übereinstimmen. Eine hierfür häufig verwendete Methode ist die sogenannte Leave-One-Out Cross-Validation (LOOCV) , die den folgenden Ansatz...
Um die Leistung eines Modells anhand eines Datensatzes zu bewerten, müssen wir messen, wie gut die vom Modell gemachten Vorhersagen mit den beobachteten Daten übereinstimmen. Die gebräuchlichste Methode zur Messung ist die Verwendung des mittleren quadratischen Fehlers (MSE), der wie folgt...
Um die Leistung eines Modells anhand eines Datensatzes zu bewerten, müssen wir messen, wie gut die vom Modell gemachten Vorhersagen mit den beobachteten Daten übereinstimmen. Eine hierfür häufig verwendete Methode ist die k-fache Kreuzvalidierung , die den folgenden Ansatz verwendet: 1....
Um die Leistung eines Modells anhand eines Datensatzes zu bewerten, müssen wir messen, wie gut die vom Modell gemachten Vorhersagen mit den beobachteten Daten übereinstimmen. Eine hierfür häufig verwendete Methode ist die k-fache Kreuzvalidierung , die den folgenden Ansatz verwendet: 1....
Beim maschinellen Lernen erstellen wir häufig Modelle, um genaue Vorhersagen über bestimmte Phänomene treffen zu können. Angenommen, wir möchten ein Regressionsmodell erstellen, das die Prädiktorvariable Lernstunden verwendet, um den ACT-Score der Antwortvariable für Oberstufenschüler vorherzusagen. Um dieses Modell zu erstellen, sammeln...
Bootstrapping ist eine Methode, mit der der Standardfehler jeder Statistik geschätzt und einKonfidenzintervall für die Statistik erstellt werden kann. Der grundlegende Prozess für das Bootstrapping ist wie folgt: Nehmen Sie k Replikatproben mit Ersetzung aus einem bestimmten Datensatz. Berechnen Sie für...
Beim maschinellen Lernen möchten wir häufig Modelle mithilfe einer Reihe von Prädiktorvariablen und einer Antwortvariablen erstellen. Unser Ziel ist es, ein Modell zu erstellen, das die Prädiktorvariablen effektiv nutzen kann, um den Wert der Antwortvariablen vorherzusagen. Bei einem Satz von insgesamt...
Im Bereich des maschinellen Lernens besteht unser Ziel darin, ein Modell zu erstellen, das eine Reihe von Prädiktorvariablen effektiv verwenden kann, um den Wert einer Antwortvariablen vorherzusagen. Bei einem Satz von insgesamt p Prädiktorvariablen gibt es viele Modelle, die wir möglicherweise...
Wenn Sie Datums- und Uhrzeitdaten in R importieren, werden die Werte häufig als Zeichenfolgen importiert. Der einfachste Weg, Strings in Datumsangaben in R umzuwandeln, ist die Verwendung der Funktion as.Date() , die die folgende Syntax verwendet: like.Date(x, format) Gold: x: Ein...