Як розрахувати біноміальний довірчий інтервал у python


Довірчий інтервал для біноміальної ймовірності обчислюється за такою формулою:

Довірчий інтервал = p +/- z*(√ p(1-p) / n )

золото:

  • p: частка «успіхів»
  • z: вибране значення z
  • n: розмір вибірки

Найпростіший спосіб обчислити цей тип довірчого інтервалу в Python — скористатися функцією proportion_confint() із пакету statsmodels :

 proportion_confint ( count , nobs , alpha = 0.05 , method = ' normal ' )

золото:

  • count : кількість успіхів
  • nobs : Загальна кількість спроб
  • alpha : рівень значущості (за замовчуванням 0,05)
  • method : метод для використання для довірчого інтервалу (за замовчуванням «нормальний»)

У наступному прикладі показано, як використовувати цю функцію на практиці.

Приклад: обчислення біноміального довірчого інтервалу в Python

Припустімо, ми хочемо оцінити частку жителів округу, які підтримують певний закон.

Ми вирішили вибрати випадкову вибірку зі 100 мешканців і виявити, що 56 із них підтримують закон.

Ми можемо використати функцію proportion_confint() , щоб обчислити 95% довірчий інтервал для справжньої частки жителів, які мають цей закон у всьому окрузі:

 from statsmodels. stats . proportion import proportion_confint

#calculate 95% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 )

(0.4627099463758483, 0.6572900536241518)

95% довірчий інтервал для справжньої частки жителів округу, які підтримують закон, становить [0,4627, 0,6573] .

За замовчуванням ця функція використовує асимптотичне нормальне наближення для обчислення довірчого інтервалу. Однак ми можемо використовувати аргумент method для використання іншого методу.

Наприклад, функція за замовчуванням, яка використовується в мові програмування R для обчислення біноміального довірчого інтервалу, — це інтервал балів Вільсона.

Ми можемо використовувати такий синтаксис, щоб указати цей метод під час обчислення довірчого інтервалу в Python:

 from statsmodels. stats . proportion import proportion_confint

#calculate 95% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 , method=' wilson ')

(0.4622810465167698, 0.6532797336983921)

Це говорить нам про те, що 95% довірчий інтервал для справжньої частки жителів округу, які підтримують закон, становить [0,4623, 0,6533] .

Цей довірчий інтервал дещо відрізняється від обчисленого за допомогою звичайного наближення.

Зауважте, що ми також можемо налаштувати значення альфа , щоб обчислити інший довірчий інтервал.

Наприклад, ми можемо встановити альфа на 0,10, щоб обчислити 90% довірчий інтервал:

 from statsmodels. stats . proportion import proportion_confint

#calculate 90% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 , alpha= 0.10 , method=' wilson ')

(0.47783814499647415, 0.6390007285095451)

Це говорить нам про те, що 90% довірчий інтервал для справжньої частки жителів округу, які підтримують закон, становить [0,4778, 0,6390] .

Примітка . Ви можете знайти повну документацію щодо функції proportion_confint() тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в Python:

Як побудувати довірчий інтервал у Python
Як використовувати біноміальний розподіл у Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *