Co to są przedziały ufności?
Często w statystyce interesuje nas pomiar parametrów populacji , czyli liczb opisujących pewne cechy całej populacji.
Dwa z najczęstszych parametrów populacji to:
1. Średnia populacji: średnia wartość zmiennej w populacji (na przykład średni wzrost mężczyzn w Stanach Zjednoczonych)
2. Proporcja populacji: proporcja zmiennej w populacji (na przykład odsetek mieszkańców powiatu, którzy popierają określone prawo)
Nawet jeśli chcemy zmierzyć te parametry, gromadzenie danych o każdym osobniku w populacji w celu obliczenia parametru populacyjnego jest zazwyczaj zbyt kosztowne i czasochłonne.
Zamiast tego zazwyczaj pobieramy losową próbkę z całej populacji i wykorzystujemy przykładowe dane do oszacowania parametru populacji.
Załóżmy na przykład, że chcemy oszacować średnią wagę określonego gatunku żółwia na Florydzie. Ponieważ na Florydzie żyją tysiące żółwi, obchodzenie i ważenie każdego żółwia z osobna byłoby niezwykle czasochłonne i kosztowne.
Zamiast tego moglibyśmy pobrać prostą losową próbkę 50 żółwi i użyć średniej masy żółwi w tej próbie do oszacowania prawdziwej średniej populacji:
Problem polega na tym, że nie ma gwarancji, że średnia masa żółwi w próbie dokładnie odpowiada średniej masie żółwi w całej populacji. Na przykład możemy wybrać próbkę pełną żółwi o małej wadze lub próbkę pełną żółwi ciężkich.
Aby uchwycić tę niepewność, możemy utworzyć przedział ufności. Przedział ufności to zakres wartości, który prawdopodobnie będzie zawierał parametr populacji z pewnym poziomem ufności. Oblicza się go według następującego ogólnego wzoru:
Przedział ufności = (oszacowanie punktowe) +/- (wartość krytyczna)* (błąd standardowy)
Ta formuła tworzy przedział z dolną i górną granicą, który prawdopodobnie zawiera parametr populacji z pewnym poziomem ufności.
Przedział ufności = [dolna granica, górna granica]
Na przykład wzór na obliczenie przedziału ufności dla średniej populacji wygląda następująco:
Przedział ufności = x +/- z*(s/√ n )
Złoto:
- x : przykładowe środki
- z: wybrana wartość z
- s: odchylenie standardowe próbki
- n: wielkość próbki
Używana wartość z zależy od wybranego poziomu ufności. W poniższej tabeli przedstawiono wartość z odpowiadającą najczęściej wybieranym poziomom ufności:
Poziom pewności | wartość z |
---|---|
0,90 | 1645 |
0,95 | 1,96 |
0,99 | 2,58 |
Załóżmy na przykład, że zbieramy losową próbkę żółwi z następującymi informacjami:
- Wielkość próby n = 25
- Średnia masa próbki x = 300
- Próbka odchylenie standardowe s = 18,5
Oto jak obliczyć 90% przedział ufności dla prawdziwej średniej wagi populacji:
90% przedział ufności: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]
Interpretujemy ten przedział ufności w następujący sposób:
Istnieje 90% szans, że przedział ufności [293,91, 306,09] zawiera rzeczywistą średnią masę populacji żółwi.
Innym sposobem powiedzenia tego samego jest stwierdzenie, że istnieje tylko 10% szans, że prawdziwa średnia populacji leży poza 90% przedziałem ufności. Oznacza to, że istnieje tylko 10% szans, że rzeczywista średnia waga populacji żółwi jest większa niż 306,09 funtów lub mniejsza niż 293,91 funtów.
Nie ma znaczenia, że istnieją dwie liczby, które mogą mieć wpływ na wielkość przedziału ufności:
1. Wielkość próby: im większa wielkość próby, tym węższy przedział ufności.
2. Poziom ufności: Im wyższy poziom ufności, tym szerszy przedział ufności.
Rodzaje przedziałów ufności
Istnieje wiele rodzajów przedziałów ufności. Oto najczęściej stosowane:
Przedział ufności dla średniej
Przedział ufności dla średniej to zakres wartości, który prawdopodobnie będzie zawierał średnią populacji przy pewnym poziomie ufności. Wzór na obliczenie tego odstępu jest następujący:
Przedział ufności = x +/- z*(s/√ n )
Złoto:
- x : przykładowe środki
- z: wybrana wartość z
- s: odchylenie standardowe próbki
- n: wielkość próbki
Zasoby:
Jak obliczyć przedział ufności dla średniej
Przedział ufności dla przeciętnego kalkulatora
Przedział ufności dla różnicy między średnimi
Przedział ufności (CI) dla różnicy między średnimi to zakres wartości, który prawdopodobnie będzie zawierał prawdziwą różnicę między dwiema średnimi populacji przy pewnym poziomie ufności. Wzór na obliczenie tego odstępu jest następujący:
Przedział ufności = ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
Złoto:
- x 1 , x 2 : średnia z próbki 1, średnia z próbki 2
- t: wartość krytyczna t oparta na poziomie ufności i (n 1 + n 2 -2) stopniach swobody
- s p 2 : wariancja zbiorcza
- n 1 , n 2 : wielkość próby 1, wielkość próby 2
Złoto:
- Łączną wariancję oblicza się w następujący sposób: s p 2 = ((n 1 -1) s 1 2 + (n 2 -1) s 2 2 ) / (n 1 + n 2 -2)
- Wartość krytyczną t t można znaleźć za pomocą kalkulatora odwrotnego rozkładu t.
Zasoby:
Jak obliczyć przedział ufności dla różnicy średnich
Przedział ufności dla kalkulatora różnicy między średnimi
Przedział ufności dla proporcji
Przedział ufności dla proporcji to zakres wartości, który prawdopodobnie będzie zawierał proporcję populacji z pewnym poziomem ufności. Wzór na obliczenie tego odstępu jest następujący:
Przedział ufności = p +/- z*(√ p(1-p) / n )
Złoto:
- p: proporcja próbki
- z: wybrana wartość z
- n: wielkość próbki
Zasoby:
Jak obliczyć przedział ufności dla proporcji
Przedział ufności dla kalkulatora proporcji
Przedział ufności dla różnicy proporcji
Przedział ufności dla różnicy proporcji to zakres wartości, który prawdopodobnie będzie zawierał prawdziwą różnicę między dwiema proporcjami populacji przy pewnym poziomie ufności. Wzór na obliczenie tego odstępu jest następujący:
Przedział ufności = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
Złoto:
- p 1 , p 2 : proporcja próbki 1, proporcja próbki 2
- z: wartość krytyczna z oparta na poziomie ufności
- n 1 , n 2 : wielkość próby 1, wielkość próby 2
Zasoby:
Jak obliczyć przedział ufności dla różnicy proporcji
Przedział ufności dla kalkulatora różnicy proporcji