Unter dem zuschreibbaren Risiko versteht man den Unterschied in den Inzidenzraten zwischen Personen, die einem Risikofaktor ausgesetzt sind, und Personen, die diesem Risikofaktor nicht ausgesetzt sind. Beispielsweise könnten wir dieses Maß verwenden, um den Unterschied bei Herz-Kreislauf-Erkrankungen (Inzidenz) zwischen Rauchern (exponierten...
Die lineare Regression ist eine Methode, mit der wir die Beziehung zwischen einer oder mehreren Prädiktorvariablen und einer Antwortvariablen quantifizieren können. Wir verwenden im Allgemeinen lineare Regression mit quantitativen Variablen . Manchmal auch „numerische“ Variablen genannt, handelt es sich dabei um...
Eine Dummy-Variable ist ein Variablentyp, den wir in der Regressionsanalyse erstellen, damit wir eine kategoriale Variable als numerische Variable darstellen können, die einen von zwei Werten annimmt: Null oder Eins. Angenommen, wir haben den folgenden Datensatz und möchten Alter und Familienstand...
Eine Dummy-Variable ist ein Variablentyp, den wir in der Regressionsanalyse erstellen, damit wir eine kategoriale Variable als numerische Variable darstellen können, die einen von zwei Werten annimmt: Null oder Eins. Angenommen, wir haben den folgenden Datensatz und möchten Alter und Familienstand...
Die lineare Regression ist eine Methode, mit der wir die Beziehung zwischen einer oder mehreren Prädiktorvariablen und einer Antwortvariablen quantifizieren können. Wir verwenden im Allgemeinen lineare Regression mit quantitativen Variablen . Manchmal auch „numerische“ Variablen genannt, handelt es sich dabei um...
Zwei Begriffe, die manchmal synonym verwendet werden, sind Korrelation und Assoziation . Im Bereich der Statistik haben diese beiden Begriffe jedoch leicht unterschiedliche Bedeutungen. Insbesondere wenn wir das Wort Korrelation verwenden, sprechen wir normalerweise vom Pearson-Korrelationskoeffizienten . Es ist ein Maß...
Mit der Funktion DATEDIF() können wir die Differenz zwischen zwei Datumsangaben in Excel berechnen. Diese Funktion verwendet die folgende Syntax: =DATEDIF(Start_Date, End_Date, Metrik) Gold: Start_Date: das Startdatum End_Date: das Enddatum Metrik: die zu berechnende Metrik. Zu den Optionen gehören: „d“: Tage...
In der Statistik wird eine Wahrscheinlichkeitsverteilung als gedächtnislos bezeichnet, wenn die Wahrscheinlichkeit des Eintretens eines zukünftigen Ereignisses nicht durch das Eintreten vergangener Ereignisse beeinflusst wird. Es gibt nur zwei Wahrscheinlichkeitsverteilungen mit der gedächtnislosen Eigenschaft: Die Exponentialverteilung mit nicht negativen reellen Zahlen....
Wir können die Funktion pmax() verwenden, um den Maximalwert über mehrere Spalten von R zu ermitteln. Diese Funktion verwendet die folgende Syntax: pmax(…, na.rm = FALSCH) Gold: … : Eine Liste von Vektoren na.rm: Ein logisches Element, das angibt, ob fehlende...
Mit der Funktion str_replace() des stringr- Pakets in R können passende Muster in einem String ersetzt werden. Diese Funktion verwendet die folgende Syntax: str_replace(String, Muster, Ersetzung) Gold: string: Zeichenvektor Modell: Modell, nach dem gesucht werden soll Ersatz: ein Vektor von Ersatzzeichen...