Puntschattingen in r berekenen (met voorbeelden)
Een puntschatting vertegenwoordigt een getal dat we berekenen op basis van steekproefgegevens om een populatieparameter te schatten. Dit is onze best mogelijke schatting van wat de werkelijke populatieparameter zou kunnen zijn.
De volgende tabel toont de puntschatting die we gebruiken om de populatieparameters te schatten:
De maatregel | Bevolkingsparameter | Puntschatting |
---|---|---|
Gemeen | μ (populatiegemiddelde) | x (steekproefgemiddelde) |
Proportie | π (aandeel van de bevolking) | p (steekproefaandeel) |
De volgende voorbeelden laten zien hoe u puntschattingen kunt berekenen voor een populatiegemiddelde en populatieaandeel in R.
Voorbeeld 1: Puntschatting van het populatiegemiddelde
Stel dat we de gemiddelde hoogte (in inches) van een bepaald type plant in een bepaald veld willen schatten. We nemen een eenvoudig willekeurig monster van 13 planten en meten de hoogte van elke plant.
De volgende code laat zien hoe u het steekproefgemiddelde kunt berekenen:
#define data data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24) #calculate sample mean mean(data, na. rm = TRUE ) [1] 15.61538
Het monstergemiddelde is 15,6 inch. Dit vertegenwoordigt onze puntschatting van het populatiegemiddelde.
We kunnen ook de volgende code gebruiken om een betrouwbaarheidsinterval van 95% voor het populatiegemiddelde te berekenen:
#find sample size, sample mean, and sample standard deviation n <- length(data) xbar <- mean(data, na. rm = TRUE ) s <- sd(data) #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 12.03575 high <- xbar + margin high [1] 19.19502
Het 95% betrouwbaarheidsinterval voor het populatiegemiddelde is [12,0, 19,2] inch.
Voorbeeld 2: Puntschatting van populatieaandeel
Stel dat we een schatting willen maken van het aandeel mensen in een bepaalde stad dat een bepaalde wet steunt. We interviewen een eenvoudige willekeurige steekproef van twintig burgers.
De volgende code laat zien hoe u de steekproefaandeel berekent:
#define data data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N') #find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n p [1] 0.6
Het aandeel van de steekproef van burgers dat de wet steunt, is 0,6 . Dit vertegenwoordigt onze puntschatting van het bevolkingsaandeel.
We kunnen ook de volgende code gebruiken om een betrouwbaarheidsinterval van 95% voor het populatiegemiddelde te berekenen:
#find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.3852967 high <- p + margin high [1] 0.8147033
Het 95% betrouwbaarheidsinterval voor het populatieaandeel is [0,39, 0,81] .
Aanvullende bronnen
Hoe de samenvatting van vijf getallen in R te berekenen
Hoe betrouwbaarheidsintervallen in R te vinden
Hoe een betrouwbaarheidsinterval in R uit te zetten