So wählen sie zufallsstichproben in r aus: mit beispielen
Um eine Zufallsstichprobe in R auszuwählen, können wir die Funktion sample() verwenden, die die folgende Syntax verwendet:
Beispiel(x, Größe, ersetzen=FALSCH, prob=NULL)
Gold:
- x: ein Vektor von Elementen zur Auswahl.
- Größe: Stichprobengröße.
- ersetzen: ob mit Ersatz abgetastet werden soll oder nicht. Der Standardwert ist false.
- prob: Vektor der Wahrscheinlichkeitsgewichte, um Elemente aus dem Vektor zu erhalten. Der Standardwert ist NULL.
In diesem Tutorial wird erläutert, wie Sie mit dieser Funktion eine Zufallsstichprobe in R aus einem Vektor und einem Datenrahmen auswählen.
Beispiel 1: Zufallsstichprobe aus einem Vektor
Der folgende Code zeigt, wie man eine Zufallsstichprobe aus einem Vektor ohne Ersatz auswählt:
#create vector of data data <- c(1, 3, 5, 6, 7, 8, 10, 11, 12, 14) #select random sample of 5 elements without replacement sample(x=data, size=5) [1] 10 12 5 14 7
Der folgende Code zeigt, wie man eine Zufallsstichprobe aus einem Vektor mit Ersetzung auswählt:
#create vector of data data <- c(1, 3, 5, 6, 7, 8, 10, 11, 12, 14) #select random sample of 5 elements with replacement sample(x=data, size=5, replace= TRUE ) [1] 12 1 1 6 14
Beispiel 2: Zufallsstichprobe aus einem Datenblock
Der folgende Code zeigt, wie eine Zufallsstichprobe aus einem Datenrahmen ausgewählt wird:
#create data frame df <- data.frame(x=c(3, 5, 6, 6, 8, 12, 14), y=c(12, 6, 4, 23, 25, 8, 9), z=c(2, 7, 8, 8, 15, 17, 29)) #view data frame df X Y Z 1 3 12 2 2 5 6 7 3 6 4 8 4 6 23 8 5 8 25 15 6 12 8 17 7 14 9 29 #select random sample of three rows from data frame rand_df <- df[ sample ( nrow (df), size= 3 ), ] #display randomly selected rows rand_df X Y Z 4 6 23 8 7 14 9 29 1 3 12 2
Folgendes passiert in diesem Code:
1. Um eine Teilmenge eines Datenrahmens in R auszuwählen, verwenden wir die folgende Syntax: df[Zeilen, Spalten]
2. Im obigen Code wählen wir zufällig eine Stichprobe von 3 Zeilen aus dem Datenrahmen und allen Spalten aus.
3. Das Endergebnis ist eine Teilmenge des Datenrahmens mit 3 zufällig ausgewählten Zeilen.
Es ist wichtig zu beachten, dass R jedes Mal, wenn wir die Funktion sample() verwenden, eine andere Stichprobe auswählt, da die Funktion die Werte zufällig auswählt.
Um die Ergebnisse bestimmter Analysen zu reproduzieren, verwenden Sie unbedingt set.seed(some number) , damit die Funktion sample() jedes Mal dieselbe Zufallsstichprobe auswählt. Zum Beispiel:
#make this example reproducible set.seed(23) #create data frame df <- data.frame(x=c(3, 5, 6, 6, 8, 12, 14), y=c(12, 6, 4, 23, 25, 8, 9), z=c(2, 7, 8, 8, 15, 17, 29)) #select random sample of three rows from data frame rand_df <- df[ sample ( nrow (df), size= 3 ), ] #display randomly selected rows rand_df X Y Z 5 8 25 15 2 5 6 7 6 12 8 17
Jedes Mal, wenn Sie den obigen Code ausführen, werden jedes Mal dieselben drei Zeilen des Datenrahmens ausgewählt.
Zusätzliche Ressourcen
Geschichtete Probenahme in R (mit Beispielen)
Systematisches Sampling in R (mit Beispielen)
Cluster-Sampling in R: Mit Beispielen