Jak obliczyć dwumianowy przedział ufności w pythonie
Przedział ufności dla prawdopodobieństwa dwumianowego oblicza się za pomocą następującego wzoru:
Przedział ufności = p +/- z*(√ p(1-p) / n )
Złoto:
- p: proporcja „sukcesów”
- z: wybrana wartość z
- n: wielkość próbki
Najłatwiejszym sposobem obliczenia tego typu przedziału ufności w Pythonie jest użycie funkcji proporcja_confint() z pakietu statsmodels :
proportion_confint ( count , nobs , alpha = 0.05 , method = ' normal ' )
Złoto:
- count : Liczba sukcesów
- nobs : Całkowita liczba prób
- alfa : poziom istotności (domyślnie wynosi 0,05)
- metoda : metoda stosowana dla przedziału ufności (domyślnie jest to „normalny”)
Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję.
Przykład: Oblicz dwumianowy przedział ufności w Pythonie
Załóżmy, że chcemy oszacować odsetek mieszkańców powiatu, którzy opowiadają się za określonym prawem.
Decydujemy się na losową próbę 100 mieszkańców i stwierdzamy, że 56 z nich opowiada się za prawem.
Możemy użyć funkcji proporcja_confint() do obliczenia 95% przedziału ufności dla prawdziwego odsetka mieszkańców, którzy mają to prawo w całym hrabstwie:
from statsmodels. stats . proportion import proportion_confint #calculate 95% confidence interval with 56 successes in 100 trials proportion_confint(count= 56 , nobs= 100 ) (0.4627099463758483, 0.6572900536241518)
95% przedział ufności dla prawdziwego odsetka mieszkańców hrabstwa popierających prawo wynosi [0,4627, 0,6573] .
Domyślnie ta funkcja wykorzystuje asymptotyczne przybliżenie normalne do obliczenia przedziału ufności. Możemy jednak użyć argumentu metody , aby użyć innej metody.
Na przykład domyślną funkcją używaną w języku programowania R do obliczania dwumianowego przedziału ufności jest przedział wyniku Wilsona.
Możemy użyć następującej składni, aby określić tę metodę podczas obliczania przedziału ufności w Pythonie:
from statsmodels. stats . proportion import proportion_confint #calculate 95% confidence interval with 56 successes in 100 trials proportion_confint(count= 56 , nobs= 100 , method=' wilson ') (0.4622810465167698, 0.6532797336983921)
To mówi nam, że 95% przedział ufności dla prawdziwego odsetka mieszkańców hrabstwa popierających prawo wynosi [0,4623, 0,6533] .
Ten przedział ufności różni się nieco od przedziału ufności obliczonego przy użyciu przybliżenia normalnego.
Należy pamiętać, że możemy również dostosować wartość alfa , aby obliczyć inny przedział ufności.
Na przykład możemy ustawić alfa na 0,10, aby obliczyć 90% przedział ufności:
from statsmodels. stats . proportion import proportion_confint #calculate 90% confidence interval with 56 successes in 100 trials proportion_confint(count= 56 , nobs= 100 , alpha= 0.10 , method=' wilson ') (0.47783814499647415, 0.6390007285095451)
To mówi nam, że 90% przedział ufności dla prawdziwego odsetka mieszkańców hrabstwa popierających prawo wynosi [0,4778, 0,6390] .
Uwaga : pełną dokumentację funkcji proporcja_confint() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w Pythonie:
Jak wykreślić przedział ufności w Pythonie
Jak korzystać z rozkładu dwumianowego w Pythonie