Puntschattingen in r berekenen (met voorbeelden)


Een puntschatting vertegenwoordigt een getal dat we berekenen op basis van steekproefgegevens om een populatieparameter te schatten. Dit is onze best mogelijke schatting van wat de werkelijke populatieparameter zou kunnen zijn.

De volgende tabel toont de puntschatting die we gebruiken om de populatieparameters te schatten:

De maatregel Bevolkingsparameter Puntschatting
Gemeen μ (populatiegemiddelde) x (steekproefgemiddelde)
Proportie π (aandeel van de bevolking) p (steekproefaandeel)

De volgende voorbeelden laten zien hoe u puntschattingen kunt berekenen voor een populatiegemiddelde en populatieaandeel in R.

Voorbeeld 1: Puntschatting van het populatiegemiddelde

Stel dat we de gemiddelde hoogte (in inches) van een bepaald type plant in een bepaald veld willen schatten. We nemen een eenvoudig willekeurig monster van 13 planten en meten de hoogte van elke plant.

De volgende code laat zien hoe u het steekproefgemiddelde kunt berekenen:

 #define data
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#calculate sample mean
mean(data, na. rm = TRUE )

[1] 15.61538

Het monstergemiddelde is 15,6 inch. Dit vertegenwoordigt onze puntschatting van het populatiegemiddelde.

We kunnen ook de volgende code gebruiken om een betrouwbaarheidsinterval van 95% voor het populatiegemiddelde te berekenen:

 #find sample size, sample mean, and sample standard deviation
n <- length(data)
xbar <- mean(data, na. rm = TRUE )
s <- sd(data)

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

Het 95% betrouwbaarheidsinterval voor het populatiegemiddelde is [12,0, 19,2] inch.

Voorbeeld 2: Puntschatting van populatieaandeel

Stel dat we een schatting willen maken van het aandeel mensen in een bepaalde stad dat een bepaalde wet steunt. We interviewen een eenvoudige willekeurige steekproef van twintig burgers.

De volgende code laat zien hoe u de steekproefaandeel berekent:

 #define data
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
          'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

p

[1] 0.6

Het aandeel van de steekproef van burgers dat de wet steunt, is 0,6 . Dit vertegenwoordigt onze puntschatting van het bevolkingsaandeel.

We kunnen ook de volgende code gebruiken om een betrouwbaarheidsinterval van 95% voor het populatiegemiddelde te berekenen:

 #find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

Het 95% betrouwbaarheidsinterval voor het populatieaandeel is [0,39, 0,81] .

Aanvullende bronnen

Hoe de samenvatting van vijf getallen in R te berekenen
Hoe betrouwbaarheidsintervallen in R te vinden
Hoe een betrouwbaarheidsinterval in R uit te zetten

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert