Como calcular estimativas pontuais em r (com exemplos)
Uma estimativa pontual representa um número que calculamos a partir de dados amostrais para estimar um parâmetro populacional. Esta é a nossa melhor estimativa possível de qual pode ser o verdadeiro parâmetro populacional.
A tabela a seguir mostra a estimativa pontual que usamos para estimar os parâmetros populacionais:
A medida | Parâmetro populacional | Ponto estimado |
---|---|---|
Significar | μ (média da população) | x (média amostral) |
Proporção | π (proporção da população) | p (proporção da amostra) |
Os exemplos a seguir demonstram como calcular estimativas pontuais para uma média populacional e proporção populacional em R.
Exemplo 1: Estimativa pontual da média populacional
Digamos que queremos estimar a altura média (em polegadas) de um certo tipo de planta em um determinado campo. Coletamos uma amostra aleatória simples de 13 plantas e medimos a altura de cada planta.
O código a seguir mostra como calcular a média amostral:
#define data data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24) #calculate sample mean mean(data, na. rm = TRUE ) [1] 15.61538
A média da amostra é de 15,6 polegadas. Isso representa nossa estimativa pontual da média da população.
Também podemos usar o seguinte código para calcular um intervalo de confiança de 95% para a média populacional:
#find sample size, sample mean, and sample standard deviation n <- length(data) xbar <- mean(data, na. rm = TRUE ) s <- sd(data) #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 12.03575 high <- xbar + margin high [1] 19.19502
O intervalo de confiança de 95% para a média populacional é [12,0, 19,2] polegadas.
Exemplo 2: Estimativa pontual da proporção populacional
Suponha que queiramos estimar a proporção de pessoas numa determinada cidade que apoiam uma determinada lei. Entrevistamos uma amostra aleatória simples de 20 cidadãos.
O código a seguir mostra como calcular a proporção da amostra:
#define data data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N') #find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n p [1] 0.6
A proporção da amostra de cidadãos que apoiam a lei é de 0,6 . Isso representa nossa estimativa pontual da proporção da população.
Também podemos usar o seguinte código para calcular um intervalo de confiança de 95% para a média populacional:
#find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.3852967 high <- p + margin high [1] 0.8147033
O intervalo de confiança de 95% para a proporção da população é [0,39, 0,81] .
Recursos adicionais
Como calcular o resumo de cinco números em R
Como encontrar intervalos de confiança em R
Como traçar um intervalo de confiança em R