Jak znaleźć przedziały ufności w r (z przykładami)
Przedział ufności to zakres wartości, który prawdopodobnie będzie zawierał parametr populacji z pewnym poziomem ufności.
Oblicza się go według następującego ogólnego wzoru:
Przedział ufności = (oszacowanie punktowe) +/- (wartość krytyczna)* (błąd standardowy)
Ta formuła tworzy przedział z dolną i górną granicą, który prawdopodobnie zawiera parametr populacji z pewnym poziomem ufności:
Przedział ufności = [dolna granica, górna granica]
W tym samouczku wyjaśniono, jak obliczyć następujące przedziały ufności w R:
1. Przedział ufności dla średniej
2. Przedział ufności dla różnicy średnich
3. Przedział ufności dla proporcji
4. Przedział ufności dla różnicy proporcji
Chodźmy!
Przykład 1: Przedział ufności dla średniej
Do obliczenia przedziału ufności dla średniej używamy następującego wzoru:
Przedział ufności = x +/- t n-1, 1-α/2 *(s/√n)
Złoto:
- x : przykładowe środki
- t: wartość krytyczna t
- s: odchylenie standardowe próbki
- n: wielkość próbki
Przykład: Załóżmy, że zbieramy losową próbkę żółwi z następującymi informacjami:
- Wielkość próby n = 25
- Średnia masa próbki x = 300
- Próbka odchylenie standardowe s = 18,5
Poniższy kod pokazuje, jak obliczyć 95% przedział ufności dla prawdziwej średniej masy populacji żółwi:
#input sample size, sample mean, and sample standard deviation n <- 25 xbar <- 300 s <- 18.5 #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 292.3636 high <- xbar + margin high [1] 307.6364
95% przedział ufności dla prawdziwej średniej masy populacji żółwi wynosi [292,36, 307,64] .
Przykład 2: Przedział ufności dla różnicy średnich
Do obliczenia przedziału ufności dla różnicy średnich populacji stosujemy następujący wzór:
Przedział ufności = ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
Złoto:
- x 1 , x 2 : średnia z próbki 1, średnia z próbki 2
- t: wartość krytyczna t oparta na poziomie ufności i (n 1 + n 2 -2) stopniach swobody
- s p 2 : wariancja zbiorcza, obliczona jako ((n 1 -1) s 1 2 + (n 2 -1) s 2 2 ) / (n 1 + n 2 -2)
- t: wartość krytyczna t
- n 1 , n 2 : wielkość próby 1, wielkość próby 2
Przykład: Załóżmy, że chcemy oszacować różnicę w średniej masie dwóch różnych gatunków żółwi. Dlatego pobieramy losową próbkę 15 żółwi z każdej populacji. Oto podsumowanie danych dla każdej próbki:
Próbka 1:
- x1 = 310
- s 1 = 18,5
- n 1 = 15
Próbka 2:
- x2 = 300
- s2 = 16,4
- n2 = 15
Poniższy kod pokazuje, jak obliczyć 95% przedział ufności dla prawdziwej różnicy średnich z populacji:
#input sample size, sample mean, and sample standard deviation n1 <- 15 xbar1 <- 310 s1 <- 18.5 n2 <- 15 xbar2 <- 300 s2 <- 16.4 #calculate pooled variance sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2) #calculate margin of error margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2) #calculate lower and upper bounds of confidence interval low <- (xbar1-xbar2) - margin low [1] -3.055445 high <- (xbar1-xbar2) + margin high [1] 23.05544
95% przedział ufności dla prawdziwej różnicy między średnimi populacji wynosi [-3,06; 23,06] .
Przykład 3: Przedział ufności dla proporcji
Do obliczenia przedziału ufności dla proporcji używamy następującego wzoru:
Przedział ufności = p +/- z*(√ p(1-p) / n )
Złoto:
- p: proporcja próbki
- z: wybrana wartość z
- n: wielkość próbki
Przykład: Załóżmy, że chcemy oszacować odsetek mieszkańców hrabstwa, którzy opowiadają się za określonym prawem. Wybieramy losową próbę 100 mieszkańców i pytamy ich, jakie jest ich stanowisko w świetle prawa. Oto wyniki:
- Wielkość próby n = 100
- Proporcja na korzyść prawa p = 0,56
Poniższy kod pokazuje, jak obliczyć 95% przedział ufności dla prawdziwego odsetka mieszkańców całego hrabstwa, którzy opowiadają się za prawem:
#input sample size and sample proportion n <- 100 p <- .56 #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.4627099 high <- p + margin high [1] 0.6572901
95% przedział ufności dla prawdziwego odsetka mieszkańców całego hrabstwa, którzy opowiadają się za prawem, wynosi [0,463, 0,657] .
Przykład 4: Przedział ufności dla różnicy proporcji
Do obliczenia przedziału ufności dla różnicy proporcji używamy następującego wzoru:
Przedział ufności = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
Złoto:
- p 1 , p 2 : proporcja próbki 1, proporcja próbki 2
- z: wartość krytyczna z oparta na poziomie ufności
- n 1 , n 2 : wielkość próby 1, wielkość próby 2
Przykład: Załóżmy, że chcemy oszacować różnicę między odsetkiem mieszkańców popierających określone prawo w hrabstwie A a odsetkiem mieszkańców popierających prawo w hrabstwie B. Oto podsumowanie danych dla każdej próby:
Próbka 1:
- n1 = 100
- p 1 = 0,62 (tj. 62 mieszkańców na 100 popiera ustawę)
Próbka 2:
- n2 = 100
- p 2 = 0,46 (tj. 46 mieszkańców na 100 popiera ustawę)
Poniższy kod pokazuje, jak obliczyć 95% przedział ufności dla prawdziwej różnicy w odsetku mieszkańców popierających prawo pomiędzy powiatami:
#input sample sizes and sample proportions n1 <- 100 p1 <- .62 n2 <- 100 p2 <- .46 #calculate margin of error margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2) #calculate lower and upper bounds of confidence interval low <- (p1-p2) - margin low [1] 0.02364509 high <- (p1-p2) + margin high [1] 0.2963549
95% przedział ufności dla prawdziwej różnicy w odsetku mieszkańców popierających prawo pomiędzy powiatami wynosi [0,024; 0,296] .
Więcej samouczków R znajdziesz tutaj .