Der exakte Fisher-Test wird verwendet, um zu bestimmen, ob zwischen zwei kategorialen Variablen ein signifikanter Zusammenhang besteht oder nicht. Er wird im Allgemeinen als Alternative zumChi-Quadrat-Unabhängigkeitstest verwendet, wenn eine oder mehrere Zellenzahlen in einer 2 × 2-Tabelle weniger als 5 betragen....
Sie können die folgende grundlegende Syntax verwenden, um Achsenintervalle in einem Basis-R-Diagramm zu ändern: #create plot with no axis intervals plot(x, y, xaxt=' n ', yaxt=' n ') #specifty x-axis interval axis(side= 1 , at=c(1, 5, 10, 15)) #specify y-axis interval...
Sie können das Argument theme() in ggplot2 verwenden, um die Randbereiche eines Plots zu ändern: ggplot(df, aes(x=x)) + geom_histogram() + theme(plot. margin =unit(c(5,1,1,1), ' cm ')) Beachten Sie, dass die Reihenfolge der Plotränder wie folgt ist: Einheit(c(oben, rechts, unten, links), Einheiten)...
Sie können die folgenden Funktionen aus dem Lubridate- Paket in R verwenden, um den Wochentag schnell zu finden: Methode 1: Ermitteln Sie den numerischen Tag der Woche (vorausgesetzt, die Woche beginnt am Sonntag) wday(df$date_column) Methode 2: Ermitteln Sie den numerischen Tag...
Viele statistische Tests gehen davon aus , dass Datensätze normalverteilt sind. Es gibt vier gängige Methoden, diese Annahme in R zu überprüfen: 1. (Visuelle Methode) Erstellen Sie ein Histogramm. Wenn das Histogramm annähernd „glockenförmig“ ist, wird davon ausgegangen, dass die Daten...
Cramers V ist ein Maß für die Stärke der Assoziation zwischen zwei nominalen Variablen. Es geht von 0 auf 1, wobei: 0 bedeutet, dass zwischen den beiden Variablen kein Zusammenhang besteht. 1 zeigt eine perfekte Assoziation zwischen den beiden Variablen an....
Der Standardfehler einer Regressionssteigung ist eine Möglichkeit, die „Unsicherheit“ bei der Schätzung einer Regressionssteigung zu messen. Es wird wie folgt berechnet: Gold: n : Gesamtstichprobengröße y i : realer Wert der Antwortvariablen ŷ i : vorhergesagter Wert der Antwortvariablen x i...
Regressionsmodelle werden verwendet, um die Beziehung zwischen einer oder mehreren Prädiktorvariablen und einer Antwortvariablen zu quantifizieren. Wann immer wir ein Regressionsmodell anpassen, möchten wir verstehen, wie gut das Modell die Werte der Prädiktorvariablen verwenden kann, um den Wert der Antwortvariablen vorherzusagen....
Es gibt zwei häufige Szenarien, in denen es sinnvoll ist, beim Erstellen von Diagrammen eine logarithmische Skala zu verwenden: Szenario 1: Einige Werte liegen deutlich über allen anderen Werten. Durch die Verwendung einer logarithmischen Skala ist es einfacher, die kleineren Werte...
Ein halblogarithmisches Diagramm ist ein Diagrammtyp, der eine lineare Skala auf der x-Achse und eine logarithmische Skala auf der y-Achse verwendet. Wir verwenden diesen Diagrammtyp häufig, wenn die Werte der y-Variablen eine viel größere Variabilität aufweisen als die Werte der x-Variablen....