Przedział ufności
W tym artykule wyjaśniono, czym jest przedział ufności w statystyce i do czego się go używa. Znajdziesz tu także czynniki wpływające na przedziały ufności oraz sposób obliczania przedziału ufności.
Co to jest przedział ufności?
W statystyce przedział ufności to przedział dający przybliżenie wartości, pomiędzy którymi wartość parametru populacji łączy się z pewnym poziomem ufności. Najpopularniejsze przedziały ufności mają poziom ufności 95% lub 99%.
Na przykład, jeśli przedział ufności dla średniej populacji o poziomie ufności 95% wynosi (3,7), oznacza to, że średnia badanej populacji będzie wynosić od 3 do 7 z prawdopodobieństwem 95%.
Dlatego przedział ufności służy do oszacowania dwóch wartości, pomiędzy którymi mieści się parametr populacji. Generalnie wartości parametrów populacji są nieznane, dlatego na podstawie danych w próbie oblicza się przedział ufności, aby oszacować parametry populacji.
Czynniki wpływające na przedział ufności
Kiedy już zapoznamy się z definicją przedziału ufności, zobaczymy, od jakich czynników zależą przedziały ufności, aby lepiej zrozumieć tę koncepcję.
- Wielkość próby : liczba zbadanych obserwacji wpływa na precyzję przedziału ufności, ponieważ im więcej mamy danych, tym łatwiej można oszacować wartość. Ogólnie rzecz biorąc, im większa wielkość próby, tym mniejsza szerokość przedziału ufności.
- Margines błędu : im większy błąd dopuszczalny, tym większy przedział ufności, a zatem tym większe prawdopodobieństwo, że prawdziwa wartość parametru mieści się w przedziale ufności. Jednak margines błędu zmniejsza precyzję przedziału ufności.
- Poziom ufności : prawdopodobieństwo, że oszacowanie statystyki populacji mieści się w przedziale ufności. Zwykle poziom ufności przedziału jest oznaczany jako 1-α i wyrażany w procentach. Wysoki poziom ufności zwiększa prawdopodobieństwo, że prawdziwa wartość leży pomiędzy granicami przedziału, ale także zwiększa szerokość przedziału.
- Szacowany parametr : przedział ufności zależy od parametru, który ma być aproksymowany. W rzeczywistości wzór stosowany do obliczania przedziału ufności zależy od przybliżonego parametru.
Jak obliczyć przedział ufności
Poniżej przedstawiono wzór, jaki należy zastosować do obliczenia każdego rodzaju przedziału ufności, ponieważ w zależności od tego, czy chcemy wyznaczyć przedział ufności dla średniej, wariancji czy proporcji, formuła, którą należy zastosować, jest inna.
Przedział ufności dla średniej
Wychodząc z faktu, że proces wpisywania zmiennej odbywa się w następujący sposób:
Przedział ufności dla średniej oblicza się, dodając i odejmując od średniej próbki wartość Z α/2 pomnożoną przez odchylenie standardowe (σ) i podzieloną przez pierwiastek kwadratowy z wielkości próby (n). Zatem wzór na obliczenie przedziału ufności średniej jest następujący:
Dla dużych próbek i poziomu ufności 95% wartością krytyczną jest Z α/2 = 1,96, a dla poziomu ufności 99% wartością krytyczną jest Z α/2 = 2,576.
Powyższy wzór stosuje się, gdy znana jest wariancja populacji. Jeśli jednak wariancja populacji jest nieznana, co jest najczęstszym przypadkiem, przedział ufności dla średniej oblicza się za pomocą następującego wzoru:
Złoto:
-
to przykładowe środki.
-
jest wartością rozkładu t-Studenta n-1 stopni swobody z prawdopodobieństwem α/2.
-
jest odchyleniem standardowym próbki.
-
to wielkość próbki.
Przedział ufności dla wariancji
Aby obliczyć przedział ufności dla wariancji populacji, stosuje się rozkład chi-kwadrat. Dokładniej, wzór na obliczenie przedziału ufności dla wariancji jest następujący:
Złoto:
-
to wielkość próbki.
-
jest odchyleniem standardowym próbki.
-
jest wartością rozkładu chi-kwadrat z n-1 stopniami swobody dla prawdopodobieństwa mniejszego niż α/2.
-
jest wartością rozkładu Chi-kwadrat z n-1 stopniami swobody dla prawdopodobieństwa większego niż 1-α/2.
Przedział ufności dla proporcji
Przedział ufności dla proporcji oblicza się, dodając i odejmując od proporcji próbki wartość Z α/2 pomnożoną przez pierwiastek kwadratowy proporcji próbki (p) pomnożony przez 1-p i podzielony przez liczebność próby (n). Zatem wzór na obliczenie przedziału ufności dla proporcji jest następujący:
Złoto:
-
jest proporcją próbki.
-
to wielkość próbki.
-
jest kwantylem standardowego rozkładu normalnego odpowiadającym prawdopodobieństwu α/2. Dla dużych próbek i poziomu ufności 95% jest to zwykle bliskie 1,96, a dla poziomu ufności 99% jest zwykle bliskie 2,576.