Clusterbemonstering in r: met voorbeelden


Onderzoekers nemen vaak steekproeven uit een populatie en gebruiken de gegevens uit de steekproef om conclusies te trekken over de populatie als geheel.

Een veelgebruikte bemonsteringsmethode is clusterbemonstering , waarbij een populatie in clusters wordt verdeeld en alle leden van bepaalde clusters worden gekozen om in de steekproef te worden opgenomen.

In deze zelfstudie wordt uitgelegd hoe u clusterbemonstering uitvoert in R.

Voorbeeld: Clusterbemonstering in R

Stel dat een bedrijf dat rondleidingen door de stad aanbiedt, een enquête wil houden onder zijn klanten. Uit de tien tours die ze per dag aanbieden, selecteren ze willekeurig vier tours en vragen ze elke klant om zijn ervaring te beoordelen op een schaal van 1 tot 10.

De volgende code laat zien hoe u een nepdataframe in R kunt maken om mee te werken:

 #make this example reproducible
set.seed(1)

#create data frame
df <- data.frame(tour = rep(1:10, each=20),
                 experience = rnorm(200, mean=7, sd=1))

#view first six rows of data frame
head(df)

  tour experience
1 1 6.373546
2 1 7.183643
3 1 6.164371
4 1 8.595281
5 1 7.329508
6 1 6.179532

En de volgende code laat zien hoe u een steekproef van klanten kunt verkrijgen door willekeurig vier bezoeken te selecteren en elk lid van die bezoeken in de steekproef op te nemen:

 #randomly choose 4 tour groups out of the 10
clusters <- sample( unique (df$tour), size=4, replace= F )

#define sample as all members who belong to one of the 4 tour groups
cluster_sample <- df[df$tour %in% clusters, ]

#view how many customers came from each tour
table(cluster_sample$tour)

 2 7 8 10 
20 20 20 20 

Uit het resultaat kunnen we zien dat:

  • In de steekproef waren 20 klanten van toeristengroep nr. 2 opgenomen.
  • In de steekproef waren 20 klanten van reisgroep #7 opgenomen.
  • In de steekproef waren 20 klanten van reisgroep #8 opgenomen.
  • In de steekproef waren 20 klanten van reisgroep #10 opgenomen.

Deze steekproef bestaat dus uit in totaal 80 klanten uit 4 verschillende toeristische groepen.

Gerelateerd: Hoe de %in% operator in R te gebruiken

Aanvullende bronnen

Inzicht in de verschillende soorten bemonsteringsmethoden
Gestratificeerde bemonstering in R
Systematische bemonstering in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert