Zależność między wielkością próby a marginesem błędu
Często w statystyce chcemy oszacować wartość jakiegoś parametru populacji , takiego jak odsetek populacji lub średnia populacji .
Aby oszacować te wartości, zwykle zbieramy prostą próbkę losową i obliczamy jej proporcję lub średnią z próbki.
Następnie konstruujemy przedział ufności , aby uchwycić naszą niepewność wokół tych szacunków.
Do obliczenia przedziału ufności dla proporcji populacji używamy następującego wzoru:
Przedział ufności = p ± z*√ p(1-p) / n
Złoto:
- p: proporcja próbki
- z: wybrana wartość z
- n: wielkość próbki
Używamy następującego wzoru do obliczenia przedziału ufności dla średniej populacji:
Przedział ufności = x̄ ± z*(s/√ n )
Złoto:
- x̄: średnia próbki
- z: wybrana wartość z
- s : odchylenie standardowe próbki
- n: wielkość próbki
W obu wzorach istnieje odwrotna zależność między wielkością próby a marginesem błędu.
Im większa wielkość próby, tym niższy margines błędu. I odwrotnie, im mniejsza wielkość próby, tym większy margines błędu.
Aby lepiej to zrozumieć, przejrzyj poniższe dwa przykłady.
Przykład 1: Wielkość próby i margines błędu dla proporcji populacji
Do obliczenia przedziału ufności dla proporcji populacji używamy następującego wzoru:
Przedział ufności = p ± z*√ p(1-p) / n
Część zaznaczona na czerwono nazywana jest marginesem błędu :
Przedział ufności = p ± z*√ p(1-p) / n
Należy pamiętać, że w granicach błędu dzielimy przez n (wielkość próby).
Zatem gdy wielkość próby jest duża, dzielimy przez dużą liczbę, co zmniejsza całkowity margines błędu. Prowadzi to do węższego przedziału ufności.
Załóżmy na przykład, że zbieramy prostą losową próbkę danych zawierającą następujące informacje:
- p: 0,6
- n: 25
Oto jak obliczyć 95% przedział ufności dla proporcji populacji:
- Przedział ufności = p ± z*√ p(1-p) / n
- Przedział ufności = 0,6 ± 1,96*√ 0,6(1-0,6) / 25
- Przedział ufności = 0,6 ± 0,192
- Przedział ufności = [0,408, 0,792]
Teraz rozważmy, czy zamiast tego użylibyśmy próby o wielkości 200. Oto jak obliczylibyśmy 95% przedział ufności dla proporcji populacji:
- Przedział ufności = p ± z*√ p(1-p) / n
- Przedział ufności = 0,6 ± 1,96*√ 0,6(1-0,6) / 200
- Przedział ufności = 0,6 ± 0,068
- Przedział ufności = [0,532, 0,668]
Należy zauważyć, że po prostu zwiększając wielkość próby, byliśmy w stanie zmniejszyć margines błędu i uzyskać znacznie węższy przedział ufności.
Przykład 2: Wielkość próby i margines błędu średniej populacji
Do obliczenia przedziału ufności dla średniej populacji stosujemy następujący wzór:
Przedział ufności = x̄ ± z*(s/√ n )
Część zaznaczona na czerwono nazywana jest marginesem błędu :
Przedział ufności = x̄ ± z*(s/√ n )
Należy pamiętać, że w granicach błędu dzielimy przez n (wielkość próby).
Zatem gdy wielkość próby jest duża, dzielimy przez dużą liczbę, co zmniejsza całkowity margines błędu. Prowadzi to do węższego przedziału ufności.
Załóżmy na przykład, że zbieramy prostą losową próbkę danych zawierającą następujące informacje:
- x̄: 15
- s : 4
- n: 25
Oto jak obliczyć 95% przedział ufności dla średniej populacji:
- Przedział ufności = x̄ ± z*(s/√ n )
- Przedział ufności = 15 ± 1,96*(4/√ 25 )
- Przedział ufności = 15 ± 1,568
- Przedział ufności = [13,432, 16,568]
Teraz rozważmy, czy zamiast tego użylibyśmy próby o wielkości 200. Oto jak obliczylibyśmy 95% przedział ufności dla średniej populacji:
- Przedział ufności = x̄ ± z*(s/√ n )
- Przedział ufności = 15 ± 1,96*(4/√ 200 )
- Przedział ufności = 15 ± 0,554
- Przedział ufności = [14,446, 15,554]
Należy zauważyć, że po prostu zwiększając wielkość próby, byliśmy w stanie zmniejszyć margines błędu i uzyskać węższy przedział ufności.
Dodatkowe zasoby
Poniższe samouczki zawierają dodatkowe informacje na temat przedziałów ufności dla proporcji:
Poniższe samouczki zawierają dodatkowe informacje na temat przedziałów ufności dla średniej: