Como encontrar intervalos de confiança em r (com exemplos)


Um intervalo de confiança é um intervalo de valores que provavelmente contém um parâmetro populacional com um certo nível de confiança.

É calculado de acordo com a seguinte fórmula geral:

Intervalo de confiança = (estimativa pontual) +/- (valor crítico)* (erro padrão)

Esta fórmula cria um intervalo com um limite inferior e um limite superior, que provavelmente contém um parâmetro populacional com algum nível de confiança:

Intervalo de confiança = [limite inferior, limite superior]

Este tutorial explica como calcular os seguintes intervalos de confiança em R:

1. Intervalo de confiança para uma média

2. Intervalo de confiança para diferença de médias

3. Intervalo de confiança para uma proporção

4. Intervalo de confiança para diferença de proporções

Vamos!

Exemplo 1: Intervalo de confiança para uma média

Usamos a seguinte fórmula para calcular um intervalo de confiança para uma média :

Intervalo de confiança = x +/- t n-1, 1-α/2 *(s/√n)

Ouro:

  • x : média amostral
  • t: o valor t-crítico
  • s: desvio padrão da amostra
  • n: tamanho da amostra

Exemplo: Suponha que coletamos uma amostra aleatória de tartarugas com as seguintes informações:

  • Tamanho da amostra n = 25
  • Peso médio da amostra x = 300
  • Desvio padrão amostral s = 18,5

O código a seguir mostra como calcular um intervalo de confiança de 95% para o peso médio real da população de tartarugas:

 #input sample size, sample mean, and sample standard deviation
n <- 25
xbar <- 300 
s <- 18.5

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 292.3636

high <- xbar + margin
high

[1] 307.6364

O intervalo de confiança de 95% para o verdadeiro peso médio da população de tartarugas é [292,36, 307,64] .

Exemplo 2: Intervalo de confiança para diferença de médias

Usamos a seguinte fórmula para calcular um intervalo de confiança para uma diferença nas médias populacionais :

Intervalo de confiança = ( x 1x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))

Ouro:

  • x 1 , x 2 : média da amostra 1, média da amostra 2
  • t: o valor t-crítico baseado no nível de confiança e (n 1 + n 2 -2) graus de liberdade
  • s p 2 : variância combinada, calculada como ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • t: o valor t-crítico
  • n 1 , n 2 : tamanho da amostra 1, tamanho da amostra 2

Exemplo: Suponha que queiramos estimar a diferença no peso médio entre duas espécies diferentes de tartarugas. Portanto, coletamos uma amostra aleatória de 15 tartarugas de cada população. Aqui estão os dados resumidos para cada amostra:

Amostra 1:

  • x1 = 310
  • s 1 = 18,5
  • n 1 = 15

Amostra 2:

  • x2 = 300
  • s2 = 16,4
  • n2 = 15

O código a seguir mostra como calcular um intervalo de confiança de 95% para a verdadeira diferença nas médias populacionais:

 #input sample size, sample mean, and sample standard deviation
n1 <- 15
xbar1 <- 310 
s1 <- 18.5

n2 <- 15
xbar2 <- 300
s2 <- 16.4

#calculate pooled variance
sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2)

#calculate margin of error
margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2)

#calculate lower and upper bounds of confidence interval
low <- (xbar1-xbar2) - margin
low

[1] -3.055445

high <- (xbar1-xbar2) + margin
high

[1] 23.05544

O intervalo de confiança de 95% para a verdadeira diferença entre as médias da população é [-3,06, 23,06] .

Exemplo 3: Intervalo de confiança para uma proporção

Usamos a seguinte fórmula para calcular um intervalo de confiança para uma proporção :

Intervalo de confiança = p +/- z*(√ p(1-p) / n )

Ouro:

  • p: proporção da amostra
  • z: o valor z escolhido
  • n: tamanho da amostra

Exemplo: Suponha que queiramos estimar a proporção de residentes num condado que são a favor de uma determinada lei. Selecionamos uma amostra aleatória de 100 residentes e perguntamos qual é a sua posição em relação à lei. Aqui estão os resultados:

  • Tamanho da amostra n = 100
  • Proporção a favor da lei p = 0,56

O código a seguir mostra como calcular um intervalo de confiança de 95% para a verdadeira proporção de residentes em todo o condado que são a favor da lei:

 #input sample size and sample proportion
n <- 100
p <- .56

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.4627099

high <- p + margin
high

[1] 0.6572901

O intervalo de confiança de 95% para a verdadeira proporção de residentes em todo o condado que são a favor da lei é [0,463, 0,657] .

Exemplo 4: Intervalo de confiança para diferença de proporções

Usamos a seguinte fórmula para calcular um intervalo de confiança para uma diferença em proporções :

Intervalo de confiança = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

Ouro:

  • p 1 , p 2 : proporção da amostra 1, proporção da amostra 2
  • z: o valor crítico z com base no nível de confiança
  • n 1 , n 2 : tamanho da amostra 1, tamanho da amostra 2

Exemplo: Suponha que queremos estimar a diferença entre a proporção de residentes que apoiam uma determinada lei no condado A e a proporção que apoia a lei no condado B. Aqui estão os dados resumidos para cada amostra:

Amostra 1:

  • n 1 = 100
  • p 1 = 0,62 (ou seja, 62 habitantes em cada 100 apoiam a lei)

Amostra 2:

  • n2 = 100
  • p 2 = 0,46 (ou seja, 46 habitantes em cada 100 apoiam a lei)

O código a seguir mostra como calcular um intervalo de confiança de 95% para a verdadeira diferença na proporção de residentes que apoiam a lei entre condados:

 #input sample sizes and sample proportions
n1 <- 100
p1 <- .62

n2 <- 100
p2 <- .46

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2)

#calculate lower and upper bounds of confidence interval
low <- (p1-p2) - margin
low

[1] 0.02364509


high <- (p1-p2) + margin
high

[1] 0.2963549

O intervalo de confiança de 95% para a verdadeira diferença na proporção de residentes que apoiam a lei entre condados é [0,024, 0,296] .

Você pode encontrar mais tutoriais de R aqui .

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *