Sie können Proc Sort in SAS verwenden, um doppelte Zeilen schnell aus einem Datensatz zu entfernen. Dieses Verfahren verwendet die folgende grundlegende Syntax: proc sort data =original_data out =no_dups_data nodupkey ; by _all_; run; Beachten Sie, dass das by- Argument angibt,...
Ein Mann-Whitney-U-Test (manchmal auch Wilcoxon-Rangsummentest genannt) wird verwendet, um Unterschiede zwischen zwei Stichproben zu vergleichen, wenn die Stichprobenverteilungen nicht normalverteilt sind und die Stichprobengrößen klein sind (n < 30). Er gilt als nichtparametrisches Äquivalent des t-Tests bei zwei Stichproben . In...
Die Poisson-Verteilung und die Normalverteilung sind zwei der am häufigsten verwendeten Wahrscheinlichkeitsverteilungen in der Statistik. Dieses Tutorial bietet eine kurze Erklärung jeder Distribution sowie zwei wichtige Unterschiede zwischen den Distributionen. Ein Überblick: die Poisson-Verteilung Die Poisson-Verteilung beschreibt die Wahrscheinlichkeit, in einem...
In der Statistik ist die Quantilnormalisierung eine Methode, die zwei Verteilungen hinsichtlich ihrer statistischen Eigenschaften identisch macht. Das folgende Beispiel zeigt, wie eine Quantilnormalisierung in R durchgeführt wird. Beispiel: Quantilnormalisierung in R Angenommen, wir erstellen in R den folgenden Datenrahmen, der...
Sie können die folgende Formel verwenden, um den Prozentrang gruppierter Daten zu berechnen: Perzentilrang = L + (RN/100 – M) / F * C Gold: L : Die untere Grenze des Intervalls, das den Perzentilrang enthält A : Der Perzentilrang N...
Mit der folgenden Formel können Sie das Perzentil einer Normalverteilung anhand eines Mittelwerts und einer Standardabweichung berechnen: Perzentilwert = μ + zσ Gold: μ : Durchschnitt z : Z-Score aus der Z-Tabelle, der dem Perzentilwert entspricht σ : Standardabweichung Die folgenden...
Mit der Funktion replace() in R können bestimmte Elemente eines Vektors durch neue Werte ersetzt werden. Diese Funktion verwendet die folgende Syntax: ersetzen (x, Liste, Werte) Gold: x : Vektorname Liste : Zu ersetzende Elemente Werte : Ersatzwerte Die folgenden Beispiele...
Die einfache lineare Regression ist eine Technik, mit der wir die Beziehung zwischen einer Prädiktorvariablen und einer Antwortvariablen verstehen können. Diese Technik findet eine Linie, die am besten zu den Daten „passt“ und hat die folgende Form: ŷ = b 0...
Sie können proc sgplot verwenden, um schnell ein Streudiagramm mit einer Regressionslinie in SAS zu erstellen. Die folgenden Beispiele zeigen, wie Sie dieses Verfahren in der Praxis anwenden können. Beispiel 1: Erstellen Sie ein einfaches Streudiagramm mit einer Regressionslinie Der folgende...
Die multiple lineare Regression ist eine Methode, mit der wir die Beziehung zwischen zwei oder mehr Prädiktorvariablen und einer Antwortvariablen verstehen können. In diesem Tutorial wird erläutert, wie Sie in SAS eine multiple lineare Regression durchführen. Schritt 1: Erstellen Sie die...