Poziom ufności i przedział ufności: jaka jest różnica?
Często w statystyce staramy się mierzyć parametry populacji – liczby opisujące pewne cechy całej populacji .
Na przykład możemy być zainteresowani pomiarem średniego wzrostu mężczyzn w danym kraju.
Ponieważ zbieranie danych na temat wzrostu każdego mężczyzny w kraju jest zbyt kosztowne i czasochłonne, zamiast tego zbieralibyśmy dane na podstawie prostej losowej próby mężczyzn. Następnie użylibyśmy średniego wzrostu mężczyzn w tej próbie, aby oszacować średni wzrost wszystkich mężczyzn w kraju.
Niestety nie ma gwarancji, że średni wzrost mężczyzn w próbie dokładnie odpowiada średniemu wzrostowi mężczyzn w całej populacji. Na przykład możemy wybrać próbę niższych lub wyższych mężczyzn.
Aby uchwycić naszą niepewność co do oszacowania prawdziwej średniej populacji, możemy utworzyć przedział ufności.
Przedział ufności: zakres wartości, który może zawierać parametr populacji o określonym poziomie ufności.
Przedział ufności oblicza się przy użyciu następującego wzoru ogólnego:
Przedział ufności = (oszacowanie punktowe) +/- (wartość krytyczna)* (błąd standardowy)
Na przykład wzór na obliczenie przedziału ufności dla średniej populacji wygląda następująco:
Przedział ufności = x +/- z*(s/√ n )
Złoto:
- x : średnia próbki
- z: wartość krytyczna z
- s: odchylenie standardowe próbki
- n: wielkość próbki
Krytyczna wartość z zastosowana we wzorze zależy od wybranego poziomu ufności .
Poziom ufności: Procent wszystkich możliwych próbek, od których oczekuje się, że będą zawierać parametr populacji prawdziwej.
Najczęściej wybierane poziomy ufności to 90%, 95% i 99%.
Poniższa tabela przedstawia krytyczną wartość z odpowiadającą popularnym wyborom poziomu ufności:
Poziom pewności | z wartość krytyczna |
---|---|
0,90 | 1645 |
0,95 | 1,96 |
0,99 | 2,58 |
Załóżmy na przykład, że zmierzyliśmy wzrost 25 mężczyzn i odkryliśmy, co następuje:
- Wielkość próby n = 25
- Średnia wysokość próbki x = 70 cali
- Przykładowe odchylenie standardowe s = 1,2 cala
Oto jak obliczyć przedział ufności dla prawdziwej średniej wielkości populacji, stosując poziom ufności 90% :
90% przedział ufności: 70 +/- 1,645*(1,2/√25) = [69,6052, 70,3948]
Oznacza to, że gdybyśmy zastosowali tę samą metodę próbkowania do wyboru różnych próbek i obliczyli przedział ufności dla każdej próbki, oczekiwalibyśmy, że prawdziwa średnia wielkość populacji będzie mieścić się w tym przedziale w 90% przypadków.
Załóżmy teraz, że zamiast tego obliczamy przedział ufności przy użyciu poziomu ufności 95%:
95% przedział ufności: 70 +/- 1,96*(1,2/√25) = [69,5296, 70,4704]
Należy zauważyć, że ten przedział ufności jest szerszy niż poprzedni. Rzeczywiście, im wyższy poziom ufności, tym szerszy przedział ufności.
Im wyższy poziom ufności, tym szerszy przedział ufności.
Powinno to mieć intuicyjny sens: szerszy poziom ufności wiąże się z większym prawdopodobieństwem uwzględnienia prawdziwego parametru populacji.
Streszczenie
W podsumowaniu:
Przedział ufności to zakres wartości, który prawdopodobnie będzie zawierał parametr populacji z pewnym poziomem ufności. Wykorzystuje następującą podstawową formułę:
Przedział ufności = (oszacowanie punktowe) +/- (wartość krytyczna)* (błąd standardowy)
Poziom ufności określa wartość krytyczną, którą należy zastosować w tej formule. Im wyższy poziom ufności, tym większa wartość krytyczna i tym samym szerszy przedział ufności.
Dodatkowe zasoby
Wprowadzenie do przedziałów ufności
Wprowadzenie do testowania hipotez
Co to jest ocena punktowa?