Cluster-sampling in r: mit beispielen
Forscher entnehmen häufig Stichproben aus einer Population und nutzen die Daten aus der Stichprobe, um Rückschlüsse auf die Population als Ganzes zu ziehen.
Eine häufig verwendete Stichprobenmethode ist die Cluster-Stichprobe , bei der eine Population in Cluster unterteilt wird und alle Mitglieder bestimmter Cluster für die Aufnahme in die Stichprobe ausgewählt werden.
In diesem Tutorial wird erklärt, wie man Cluster-Sampling in R durchführt.
Beispiel: Cluster-Sampling in R
Nehmen wir an, ein Unternehmen, das Stadtrundfahrten anbietet, möchte seine Kunden befragen. Aus zehn Touren, die sie pro Tag anbieten, wählen sie zufällig vier Touren aus und bitten jeden Kunden, sein Erlebnis auf einer Skala von 1 bis 10 zu bewerten.
Der folgende Code zeigt, wie man in R einen gefälschten Datenrahmen erstellt, mit dem man arbeiten kann:
#make this example reproducible set.seed(1) #create data frame df <- data.frame(tour = rep(1:10, each=20), experience = rnorm(200, mean=7, sd=1)) #view first six rows of data frame head(df) tour experience 1 1 6.373546 2 1 7.183643 3 1 6.164371 4 1 8.595281 5 1 7.329508 6 1 6.179532
Und der folgende Code zeigt, wie man eine Stichprobe von Kunden erhält, indem man vier Besuche zufällig auswählt und jedes Mitglied dieser Besuche in die Stichprobe einbezieht:
#randomly choose 4 tour groups out of the 10 clusters <- sample( unique (df$tour), size=4, replace= F ) #define sample as all members who belong to one of the 4 tour groups cluster_sample <- df[df$tour %in% clusters, ] #view how many customers came from each tour table(cluster_sample$tour) 2 7 8 10 20 20 20 20
Aus dem Ergebnis können wir Folgendes erkennen:
- In die Stichprobe wurden 20 Kunden der Touristengruppe Nr. 2 einbezogen.
- In die Stichprobe wurden 20 Kunden der Reisegruppe Nr. 7 einbezogen.
- In die Stichprobe wurden 20 Kunden der Reisegruppe Nr. 8 einbezogen.
- In die Stichprobe wurden 20 Kunden der Reisegruppe Nr. 10 einbezogen.
Somit besteht diese Stichprobe aus insgesamt 80 Kunden aus 4 verschiedenen Touristengruppen.
Verwandt: So verwenden Sie den %in%-Operator in R
Zusätzliche Ressourcen
Verständnis der verschiedenen Arten von Probenahmemethoden
Geschichtete Probenahme in R
Systematische Probenahme in R