Cluster-sampling in r: mit beispielen


Forscher entnehmen häufig Stichproben aus einer Population und nutzen die Daten aus der Stichprobe, um Rückschlüsse auf die Population als Ganzes zu ziehen.

Eine häufig verwendete Stichprobenmethode ist die Cluster-Stichprobe , bei der eine Population in Cluster unterteilt wird und alle Mitglieder bestimmter Cluster für die Aufnahme in die Stichprobe ausgewählt werden.

In diesem Tutorial wird erklärt, wie man Cluster-Sampling in R durchführt.

Beispiel: Cluster-Sampling in R

Nehmen wir an, ein Unternehmen, das Stadtrundfahrten anbietet, möchte seine Kunden befragen. Aus zehn Touren, die sie pro Tag anbieten, wählen sie zufällig vier Touren aus und bitten jeden Kunden, sein Erlebnis auf einer Skala von 1 bis 10 zu bewerten.

Der folgende Code zeigt, wie man in R einen gefälschten Datenrahmen erstellt, mit dem man arbeiten kann:

 #make this example reproducible
set.seed(1)

#create data frame
df <- data.frame(tour = rep(1:10, each=20),
                 experience = rnorm(200, mean=7, sd=1))

#view first six rows of data frame
head(df)

  tour experience
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

Und der folgende Code zeigt, wie man eine Stichprobe von Kunden erhält, indem man vier Besuche zufällig auswählt und jedes Mitglied dieser Besuche in die Stichprobe einbezieht:

 #randomly choose 4 tour groups out of the 10
clusters <- sample( unique (df$tour), size=4, replace= F )

#define sample as all members who belong to one of the 4 tour groups
cluster_sample <- df[df$tour %in% clusters, ]

#view how many customers came from each tour
table(cluster_sample$tour)

 2 7 8 10 
20 20 20 20 

Aus dem Ergebnis können wir Folgendes erkennen:

  • In die Stichprobe wurden 20 Kunden der Touristengruppe Nr. 2 einbezogen.
  • In die Stichprobe wurden 20 Kunden der Reisegruppe Nr. 7 einbezogen.
  • In die Stichprobe wurden 20 Kunden der Reisegruppe Nr. 8 einbezogen.
  • In die Stichprobe wurden 20 Kunden der Reisegruppe Nr. 10 einbezogen.

Somit besteht diese Stichprobe aus insgesamt 80 Kunden aus 4 verschiedenen Touristengruppen.

Verwandt: So verwenden Sie den %in%-Operator in R

Zusätzliche Ressourcen

Verständnis der verschiedenen Arten von Probenahmemethoden
Geschichtete Probenahme in R
Systematische Probenahme in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert