Jak znaleźć przedziały ufności w r (z przykładami)


Przedział ufności to zakres wartości, który prawdopodobnie będzie zawierał parametr populacji z pewnym poziomem ufności.

Oblicza się go według następującego ogólnego wzoru:

Przedział ufności = (oszacowanie punktowe) +/- (wartość krytyczna)* (błąd standardowy)

Ta formuła tworzy przedział z dolną i górną granicą, który prawdopodobnie zawiera parametr populacji z pewnym poziomem ufności:

Przedział ufności = [dolna granica, górna granica]

W tym samouczku wyjaśniono, jak obliczyć następujące przedziały ufności w R:

1. Przedział ufności dla średniej

2. Przedział ufności dla różnicy średnich

3. Przedział ufności dla proporcji

4. Przedział ufności dla różnicy proporcji

Chodźmy!

Przykład 1: Przedział ufności dla średniej

Do obliczenia przedziału ufności dla średniej używamy następującego wzoru:

Przedział ufności = x +/- t n-1, 1-α/2 *(s/√n)

Złoto:

  • x : przykładowe środki
  • t: wartość krytyczna t
  • s: odchylenie standardowe próbki
  • n: wielkość próbki

Przykład: Załóżmy, że zbieramy losową próbkę żółwi z następującymi informacjami:

  • Wielkość próby n = 25
  • Średnia masa próbki x = 300
  • Próbka odchylenie standardowe s = 18,5

Poniższy kod pokazuje, jak obliczyć 95% przedział ufności dla prawdziwej średniej masy populacji żółwi:

 #input sample size, sample mean, and sample standard deviation
n <- 25
xbar <- 300 
s <- 18.5

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 292.3636

high <- xbar + margin
high

[1] 307.6364

95% przedział ufności dla prawdziwej średniej masy populacji żółwi wynosi [292,36, 307,64] .

Przykład 2: Przedział ufności dla różnicy średnich

Do obliczenia przedziału ufności dla różnicy średnich populacji stosujemy następujący wzór:

Przedział ufności = ( x 1x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))

Złoto:

  • x 1 , x 2 : średnia z próbki 1, średnia z próbki 2
  • t: wartość krytyczna t oparta na poziomie ufności i (n 1 + n 2 -2) stopniach swobody
  • s p 2 : wariancja zbiorcza, obliczona jako ((n 1 -1) s 1 2 + (n 2 -1) s 2 2 ) / (n 1 + n 2 -2)
  • t: wartość krytyczna t
  • n 1 , n 2 : wielkość próby 1, wielkość próby 2

Przykład: Załóżmy, że chcemy oszacować różnicę w średniej masie dwóch różnych gatunków żółwi. Dlatego pobieramy losową próbkę 15 żółwi z każdej populacji. Oto podsumowanie danych dla każdej próbki:

Próbka 1:

  • x1 = 310
  • s 1 = 18,5
  • n 1 = 15

Próbka 2:

  • x2 = 300
  • s2 = 16,4
  • n2 = 15

Poniższy kod pokazuje, jak obliczyć 95% przedział ufności dla prawdziwej różnicy średnich z populacji:

 #input sample size, sample mean, and sample standard deviation
n1 <- 15
xbar1 <- 310 
s1 <- 18.5

n2 <- 15
xbar2 <- 300
s2 <- 16.4

#calculate pooled variance
sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2)

#calculate margin of error
margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2)

#calculate lower and upper bounds of confidence interval
low <- (xbar1-xbar2) - margin
low

[1] -3.055445

high <- (xbar1-xbar2) + margin
high

[1] 23.05544

95% przedział ufności dla prawdziwej różnicy między średnimi populacji wynosi [-3,06; 23,06] .

Przykład 3: Przedział ufności dla proporcji

Do obliczenia przedziału ufności dla proporcji używamy następującego wzoru:

Przedział ufności = p +/- z*(√ p(1-p) / n )

Złoto:

  • p: proporcja próbki
  • z: wybrana wartość z
  • n: wielkość próbki

Przykład: Załóżmy, że chcemy oszacować odsetek mieszkańców hrabstwa, którzy opowiadają się za określonym prawem. Wybieramy losową próbę 100 mieszkańców i pytamy ich, jakie jest ich stanowisko w świetle prawa. Oto wyniki:

  • Wielkość próby n = 100
  • Proporcja na korzyść prawa p = 0,56

Poniższy kod pokazuje, jak obliczyć 95% przedział ufności dla prawdziwego odsetka mieszkańców całego hrabstwa, którzy opowiadają się za prawem:

 #input sample size and sample proportion
n <- 100
p <- .56

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.4627099

high <- p + margin
high

[1] 0.6572901

95% przedział ufności dla prawdziwego odsetka mieszkańców całego hrabstwa, którzy opowiadają się za prawem, wynosi [0,463, 0,657] .

Przykład 4: Przedział ufności dla różnicy proporcji

Do obliczenia przedziału ufności dla różnicy proporcji używamy następującego wzoru:

Przedział ufności = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

Złoto:

  • p 1 , p 2 : proporcja próbki 1, proporcja próbki 2
  • z: wartość krytyczna z oparta na poziomie ufności
  • n 1 , n 2 : wielkość próby 1, wielkość próby 2

Przykład: Załóżmy, że chcemy oszacować różnicę między odsetkiem mieszkańców popierających określone prawo w hrabstwie A a odsetkiem mieszkańców popierających prawo w hrabstwie B. Oto podsumowanie danych dla każdej próby:

Próbka 1:

  • n1 = 100
  • p 1 = 0,62 (tj. 62 mieszkańców na 100 popiera ustawę)

Próbka 2:

  • n2 = 100
  • p 2 = 0,46 (tj. 46 mieszkańców na 100 popiera ustawę)

Poniższy kod pokazuje, jak obliczyć 95% przedział ufności dla prawdziwej różnicy w odsetku mieszkańców popierających prawo pomiędzy powiatami:

 #input sample sizes and sample proportions
n1 <- 100
p1 <- .62

n2 <- 100
p2 <- .46

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2)

#calculate lower and upper bounds of confidence interval
low <- (p1-p2) - margin
low

[1] 0.02364509


high <- (p1-p2) + margin
high

[1] 0.2963549

95% przedział ufności dla prawdziwej różnicy w odsetku mieszkańców popierających prawo pomiędzy powiatami wynosi [0,024; 0,296] .

Więcej samouczków R znajdziesz tutaj .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *