Jak obliczyć dwumianowy przedział ufności w pythonie


Przedział ufności dla prawdopodobieństwa dwumianowego oblicza się za pomocą następującego wzoru:

Przedział ufności = p +/- z*(√ p(1-p) / n )

Złoto:

  • p: proporcja „sukcesów”
  • z: wybrana wartość z
  • n: wielkość próbki

Najłatwiejszym sposobem obliczenia tego typu przedziału ufności w Pythonie jest użycie funkcji proporcja_confint() z pakietu statsmodels :

 proportion_confint ( count , nobs , alpha = 0.05 , method = ' normal ' )

Złoto:

  • count : Liczba sukcesów
  • nobs : Całkowita liczba prób
  • alfa : poziom istotności (domyślnie wynosi 0,05)
  • metoda : metoda stosowana dla przedziału ufności (domyślnie jest to „normalny”)

Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję.

Przykład: Oblicz dwumianowy przedział ufności w Pythonie

Załóżmy, że chcemy oszacować odsetek mieszkańców powiatu, którzy opowiadają się za określonym prawem.

Decydujemy się na losową próbę 100 mieszkańców i stwierdzamy, że 56 z nich opowiada się za prawem.

Możemy użyć funkcji proporcja_confint() do obliczenia 95% przedziału ufności dla prawdziwego odsetka mieszkańców, którzy mają to prawo w całym hrabstwie:

 from statsmodels. stats . proportion import proportion_confint

#calculate 95% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 )

(0.4627099463758483, 0.6572900536241518)

95% przedział ufności dla prawdziwego odsetka mieszkańców hrabstwa popierających prawo wynosi [0,4627, 0,6573] .

Domyślnie ta funkcja wykorzystuje asymptotyczne przybliżenie normalne do obliczenia przedziału ufności. Możemy jednak użyć argumentu metody , aby użyć innej metody.

Na przykład domyślną funkcją używaną w języku programowania R do obliczania dwumianowego przedziału ufności jest przedział wyniku Wilsona.

Możemy użyć następującej składni, aby określić tę metodę podczas obliczania przedziału ufności w Pythonie:

 from statsmodels. stats . proportion import proportion_confint

#calculate 95% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 , method=' wilson ')

(0.4622810465167698, 0.6532797336983921)

To mówi nam, że 95% przedział ufności dla prawdziwego odsetka mieszkańców hrabstwa popierających prawo wynosi [0,4623, 0,6533] .

Ten przedział ufności różni się nieco od przedziału ufności obliczonego przy użyciu przybliżenia normalnego.

Należy pamiętać, że możemy również dostosować wartość alfa , aby obliczyć inny przedział ufności.

Na przykład możemy ustawić alfa na 0,10, aby obliczyć 90% przedział ufności:

 from statsmodels. stats . proportion import proportion_confint

#calculate 90% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 , alpha= 0.10 , method=' wilson ')

(0.47783814499647415, 0.6390007285095451)

To mówi nam, że 90% przedział ufności dla prawdziwego odsetka mieszkańców hrabstwa popierających prawo wynosi [0,4778, 0,6390] .

Uwaga : pełną dokumentację funkcji proporcja_confint() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w Pythonie:

Jak wykreślić przedział ufności w Pythonie
Jak korzystać z rozkładu dwumianowego w Pythonie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *