Como calcular estimativas pontuais em r (com exemplos)


Uma estimativa pontual representa um número que calculamos a partir de dados amostrais para estimar um parâmetro populacional. Esta é a nossa melhor estimativa possível de qual pode ser o verdadeiro parâmetro populacional.

A tabela a seguir mostra a estimativa pontual que usamos para estimar os parâmetros populacionais:

A medida Parâmetro populacional Ponto estimado
Significar μ (média da população) x (média amostral)
Proporção π (proporção da população) p (proporção da amostra)

Os exemplos a seguir demonstram como calcular estimativas pontuais para uma média populacional e proporção populacional em R.

Exemplo 1: Estimativa pontual da média populacional

Digamos que queremos estimar a altura média (em polegadas) de um certo tipo de planta em um determinado campo. Coletamos uma amostra aleatória simples de 13 plantas e medimos a altura de cada planta.

O código a seguir mostra como calcular a média amostral:

 #define data
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#calculate sample mean
mean(data, na. rm = TRUE )

[1] 15.61538

A média da amostra é de 15,6 polegadas. Isso representa nossa estimativa pontual da média da população.

Também podemos usar o seguinte código para calcular um intervalo de confiança de 95% para a média populacional:

 #find sample size, sample mean, and sample standard deviation
n <- length(data)
xbar <- mean(data, na. rm = TRUE )
s <- sd(data)

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

O intervalo de confiança de 95% para a média populacional é [12,0, 19,2] polegadas.

Exemplo 2: Estimativa pontual da proporção populacional

Suponha que queiramos estimar a proporção de pessoas numa determinada cidade que apoiam uma determinada lei. Entrevistamos uma amostra aleatória simples de 20 cidadãos.

O código a seguir mostra como calcular a proporção da amostra:

 #define data
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
          'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

p

[1] 0.6

A proporção da amostra de cidadãos que apoiam a lei é de 0,6 . Isso representa nossa estimativa pontual da proporção da população.

Também podemos usar o seguinte código para calcular um intervalo de confiança de 95% para a média populacional:

 #find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

O intervalo de confiança de 95% para a proporção da população é [0,39, 0,81] .

Recursos adicionais

Como calcular o resumo de cinco números em R
Como encontrar intervalos de confiança em R
Como traçar um intervalo de confiança em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *